tgoop.com/data_hub_ir/899
Last Update:
یه ابزار فوقالعاده کاربردی پیدا کردیم که خصوصاً برای کسانی که مهارت برنامهنویسی بالایی ندارن، خیلی می تونه مفید باشه.
همیشه داده لازم داریم، چه برای مقاله دانشگاهیمون چه برای پروژه شرکتی و هر کار دیگه توی دنیای علم داده. اصلاً بدون داده مگه میشه کاری کرد؟
ولی استخراج داده از وبسایتها یا در اصطلاح کرالینگ، گاهی به شدت پیچیده است و نیاز به دانش تخصصی HTML و کتابخانههایی مثل BeautifulSoup یا Scrapy داره و گاها واقعاً حوصله سر بر میشه.
مثلاً فرض کنید میخواید از یک سایت خبری، تمام اخبار مربوط به یک موضوع خاص را جمعآوری کنید. روش سنتی این بود که باید کدهای پیچیدهای بنویسید، با ساختار HTML آشنا باشید و برای هر تغییر کوچک در سایت، دوباره کدتون را بازنویسی کنید. این خیلی بده که هر بار که سایت تغییر کنه، کد شما باید بروز بشه.
اما حالا یک ابزار جدید به نام FireCrawl این کار را کاملاً ساده کرده. این ابزار به شما امکان میده فقط با نوشتن یک پرامپت، دادههای مورد نظرتون را از هر وبسایتی استخراج کنید. بدون هیچ کدنویسی.
روش کار خیلی ساده است: شما فقط کافیه لیست URLهای مورد نظر را به FireCrawl بدید و در یک پرامپت توضیح بدید که دقیقاً چه اطلاعاتی را میخواید. سپس ابزار خودش عمل crawling را انجام داده و دادههای مرتب و ساختار یافته را برای شما آماده میکنه.
به عنوان مثال، اگر بخواید از یک سایت خبری تیتر، تاریخ انتشار و نویسنده را استخراج کنید، کافیه در پرامپت بنویسید:
"از این صفحه تیتر خبر، نام نویسنده و تاریخ انتشارش را استخراج کن."
FireCrawl بدون نیاز به نوشتن حتی یک خط کد، عمل استخراج را انجام داده و نتایج را به صورت مرتب و قابل استفاده در اختیار شما قرار میده.
https://www.firecrawl.dev
BY دیتاهاب

Share with your friend now:
tgoop.com/data_hub_ir/899