DATA_HUB_IR Telegram 899
یه ابزار فوق‌العاده کاربردی پیدا کردیم که خصوصاً برای کسانی که مهارت برنامه‌نویسی بالایی ندارن، خیلی می تونه مفید باشه.

همیشه داده لازم داریم، چه برای مقاله دانشگاهی‌مون چه برای پروژه شرکتی و هر کار دیگه توی دنیای علم داده. اصلاً بدون داده مگه میشه کاری کرد؟

ولی استخراج داده از وبسایت‌ها یا در اصطلاح کرالینگ، گاهی به شدت پیچیده است و نیاز به دانش تخصصی HTML و کتابخانه‌هایی مثل BeautifulSoup یا Scrapy داره و گاها واقعاً حوصله سر بر میشه.

مثلاً فرض کنید می‌خواید از یک سایت خبری، تمام اخبار مربوط به یک موضوع خاص را جمع‌آوری کنید. روش سنتی این بود که باید کدهای پیچیده‌ای بنویسید، با ساختار HTML آشنا باشید و برای هر تغییر کوچک در سایت، دوباره کدتون را بازنویسی کنید. این خیلی بده که هر بار که سایت تغییر کنه، کد شما باید بروز بشه.

اما حالا یک ابزار جدید به نام FireCrawl این کار را کاملاً ساده کرده. این ابزار به شما امکان می‌ده فقط با نوشتن یک پرامپت، داده‌های مورد نظرتون را از هر وبسایتی استخراج کنید. بدون هیچ کدنویسی.

روش کار خیلی ساده است: شما فقط کافیه لیست URLهای مورد نظر را به FireCrawl بدید و در یک پرامپت توضیح بدید که دقیقاً چه اطلاعاتی را می‌خواید. سپس ابزار خودش عمل crawling را انجام داده و داده‌های مرتب و ساختار یافته را برای شما آماده می‌کنه.

به عنوان مثال، اگر بخواید از یک سایت خبری تیتر، تاریخ انتشار و نویسنده را استخراج کنید، کافیه در پرامپت بنویسید:
"از این صفحه تیتر خبر، نام نویسنده و تاریخ انتشارش را استخراج کن."

FireCrawl بدون نیاز به نوشتن حتی یک خط کد، عمل استخراج را انجام داده و نتایج را به صورت مرتب و قابل استفاده در اختیار شما قرار می‌ده.

https://www.firecrawl.dev
8👍2



tgoop.com/data_hub_ir/899
Create:
Last Update:

یه ابزار فوق‌العاده کاربردی پیدا کردیم که خصوصاً برای کسانی که مهارت برنامه‌نویسی بالایی ندارن، خیلی می تونه مفید باشه.

همیشه داده لازم داریم، چه برای مقاله دانشگاهی‌مون چه برای پروژه شرکتی و هر کار دیگه توی دنیای علم داده. اصلاً بدون داده مگه میشه کاری کرد؟

ولی استخراج داده از وبسایت‌ها یا در اصطلاح کرالینگ، گاهی به شدت پیچیده است و نیاز به دانش تخصصی HTML و کتابخانه‌هایی مثل BeautifulSoup یا Scrapy داره و گاها واقعاً حوصله سر بر میشه.

مثلاً فرض کنید می‌خواید از یک سایت خبری، تمام اخبار مربوط به یک موضوع خاص را جمع‌آوری کنید. روش سنتی این بود که باید کدهای پیچیده‌ای بنویسید، با ساختار HTML آشنا باشید و برای هر تغییر کوچک در سایت، دوباره کدتون را بازنویسی کنید. این خیلی بده که هر بار که سایت تغییر کنه، کد شما باید بروز بشه.

اما حالا یک ابزار جدید به نام FireCrawl این کار را کاملاً ساده کرده. این ابزار به شما امکان می‌ده فقط با نوشتن یک پرامپت، داده‌های مورد نظرتون را از هر وبسایتی استخراج کنید. بدون هیچ کدنویسی.

روش کار خیلی ساده است: شما فقط کافیه لیست URLهای مورد نظر را به FireCrawl بدید و در یک پرامپت توضیح بدید که دقیقاً چه اطلاعاتی را می‌خواید. سپس ابزار خودش عمل crawling را انجام داده و داده‌های مرتب و ساختار یافته را برای شما آماده می‌کنه.

به عنوان مثال، اگر بخواید از یک سایت خبری تیتر، تاریخ انتشار و نویسنده را استخراج کنید، کافیه در پرامپت بنویسید:
"از این صفحه تیتر خبر، نام نویسنده و تاریخ انتشارش را استخراج کن."

FireCrawl بدون نیاز به نوشتن حتی یک خط کد، عمل استخراج را انجام داده و نتایج را به صورت مرتب و قابل استفاده در اختیار شما قرار می‌ده.

https://www.firecrawl.dev

BY دیتاهاب




Share with your friend now:
tgoop.com/data_hub_ir/899

View MORE
Open in Telegram


Telegram News

Date: |

3How to create a Telegram channel? Clear Members can post their voice notes of themselves screaming. Interestingly, the group doesn’t allow to post anything else which might lead to an instant ban. As of now, there are more than 330 members in the group. How to build a private or public channel on Telegram? Public channels are public to the internet, regardless of whether or not they are subscribed. A public channel is displayed in search results and has a short address (link).
from us


Telegram دیتاهاب
FROM American