DATASCIENCE_ASSOCIATION Telegram 885
This media is not supported in your browser
VIEW IN TELEGRAM
👨🏻‍💻کتابخانه‌ی پایتون فوق به شما کمک می‌کند از فایل‌های پیچیده مانند جدول‌ها، عکس‌ها، نمودارها یا اسناد چندصفحه‌ای، داده‌های قابل ‌استفاده برای مدل‌های زبانی استخراج کنید.


📝 ایده‌ی Agentic Document Extraction این است که برخلاف روش‌های معمول مثل OCR که فقط متن رو می‌خوانند، می‌تواند ساختار و رابطه‌ی بین بخش‌های مختلف سند را هم بفهم . مثلاً می‌فهمد یک عنوان مربوط به کدام جدول یا تصویر است.


با PDF، عکس و لینک‌ سایت‌ها کار می‌کند.

☑️ می‌تواند سندهای خیلی بزرگ (تا ۱۰۰۰ صفحه) را خود تکه‌تکه و پردازش کند.

✔️ خروجی را هم به‌صورت JSON می‌دهد و به صورت هم Markdown.

☑️ حتی محل دقیق هر بخش روی صفحه را مشخص می‌کند.

✔️ از پردازش موازی و دسته‌ای پشتیبانی می‌کند.

pip install agentic-doc


📚 Agentic Document Extraction
🌐 Website
💻
GitHub-Repos

در کانال انجمن علوم داده با ما همراه باشید🌱
|
@DataScience_Association |
❤‍🔥4🔥1💯1



tgoop.com/DataScience_Association/885
Create:
Last Update:

👨🏻‍💻کتابخانه‌ی پایتون فوق به شما کمک می‌کند از فایل‌های پیچیده مانند جدول‌ها، عکس‌ها، نمودارها یا اسناد چندصفحه‌ای، داده‌های قابل ‌استفاده برای مدل‌های زبانی استخراج کنید.


📝 ایده‌ی Agentic Document Extraction این است که برخلاف روش‌های معمول مثل OCR که فقط متن رو می‌خوانند، می‌تواند ساختار و رابطه‌ی بین بخش‌های مختلف سند را هم بفهم . مثلاً می‌فهمد یک عنوان مربوط به کدام جدول یا تصویر است.


با PDF، عکس و لینک‌ سایت‌ها کار می‌کند.

☑️ می‌تواند سندهای خیلی بزرگ (تا ۱۰۰۰ صفحه) را خود تکه‌تکه و پردازش کند.

✔️ خروجی را هم به‌صورت JSON می‌دهد و به صورت هم Markdown.

☑️ حتی محل دقیق هر بخش روی صفحه را مشخص می‌کند.

✔️ از پردازش موازی و دسته‌ای پشتیبانی می‌کند.

pip install agentic-doc


📚 Agentic Document Extraction
🌐 Website
💻
GitHub-Repos

در کانال انجمن علوم داده با ما همراه باشید🌱
|
@DataScience_Association |

BY انجمن علوم داده


Share with your friend now:
tgoop.com/DataScience_Association/885

View MORE
Open in Telegram


Telegram News

Date: |

As the broader market downturn continues, yelling online has become the crypto trader’s latest coping mechanism after the rise of Goblintown Ethereum NFTs at the end of May and beginning of June, where holders made incoherent groaning sounds and role-played as urine-loving goblin creatures in late-night Twitter Spaces. With Bitcoin down 30% in the past week, some crypto traders have taken to Telegram to “voice” their feelings. End-to-end encryption is an important feature in messaging, as it's the first step in protecting users from surveillance. Polls “[The defendant] could not shift his criminal liability,” Hui said.
from us


Telegram انجمن علوم داده
FROM American