آموزش اسکرپینگ Good On You: راهنمای استخراج اخلاقی داده‌های برندها

بیاموزید چگونه رتبه‌بندی‌های اخلاقی برندها و امتیازات پایداری را از Good On You اسکرپ کنید. استخراج داده‌های ارزشمند برای تحقیقات بازار و اپلیکیشن‌های خرید...

Good On You favicon
goodonyou.ecoمتوسط
پوشش:GlobalNorth AmericaEuropeAustralia
داده‌های موجود8 فیلد
عنوانقیمتموقعیتتوضیحاتتصاویرتاریخ انتشاردسته‌بندی‌هاویژگی‌ها
تمام فیلدهای قابل استخراج
نام برندامتیاز رتبه‌بندی کلیامتیاز محیط زیستامتیاز حقوق کارگرانامتیاز رفاه حیواناترده قیمتی ($ - $$$$)محل دفتر مرکزی برندمتن خلاصه اخلاقینشان‌های گواهینامهتاریخ آخرین به‌روزرسانیجزئیات پایداری مواد مصرفیاطلاعات انتشار کربن
الزامات فنی
نیاز به جاوااسکریپت
بدون نیاز به ورود
دارای صفحه‌بندی
API رسمی موجود
حفاظت ضد ربات شناسایی شد
CloudflareRate LimitingJavaScript ChallengesBrowser Fingerprinting

حفاظت ضد ربات شناسایی شد

Cloudflare
WAF و مدیریت ربات در سطح سازمانی. از چالش‌های JavaScript، CAPTCHA و تحلیل رفتاری استفاده می‌کند. نیاز به اتوماسیون مرورگر با تنظیمات مخفی دارد.
محدودیت نرخ
درخواست‌ها را بر اساس IP/جلسه در طول زمان محدود می‌کند. با پراکسی‌های چرخشی، تأخیر درخواست‌ها و اسکرپینگ توزیع‌شده قابل دور زدن است.
چالش JavaScript
برای دسترسی به محتوا نیاز به اجرای JavaScript دارد. درخواست‌های ساده ناموفق هستند؛ مرورگر بدون رابط مانند Playwright یا Puppeteer لازم است.
اثر انگشت مرورگر
ربات‌ها را از طریق ویژگی‌های مرورگر شناسایی می‌کند: canvas، WebGL، فونت‌ها، افزونه‌ها. نیاز به جعل یا پروفایل‌های واقعی مرورگر دارد.

درباره Good On You

کشف کنید Good On You چه چیزی ارائه می‌دهد و چه داده‌های ارزشمندی می‌توان استخراج کرد.

دایرکتوری پیشرو در زمینه پایداری

سایت Good On You معتبرترین منبع جهان برای رتبه‌بندی اخلاقی برندها در صنایع مد و زیبایی است. این پلتفرم هزاران برند را بر اساس تأثیر آن‌ها بر مردم، سیاره و حیوانات با استفاده از یک مقیاس ساده ۵ امتیازی ارزیابی می‌کند. این پلتفرم با تجمیع داده‌ها از افشاهای برند، گواهینامه‌هایی مانند B-Corp و گزارش‌های NGO در قالب پروفایل‌های قابل دسترس، خدماتی حیاتی ارائه می‌دهد.

داده‌های باارزش ESG

برای محققان و توسعه‌دهندگان، Good On You بینش‌های ساختاریافته‌ای درباره پایداری شرکتی ارائه می‌دهد. داده‌های اسکرپ شده می‌تواند شامل همه چیز از استفاده از مواد و سیاست‌های مدیریت پسماند تا شرایط کار و استانداردهای رفاه حیوانات باشد. این اطلاعات برای ساختن ابزارهای خرید آگاهانه، انجام بنچمارک‌های ESG و ردیابی پیشرفت صنعت به سمت تولید اخلاقی ضروری است.

درباره Good On You

چرا Good On You را اسکرپ کنیم؟

ارزش تجاری و موارد استفاده برای استخراج داده از Good On You را کشف کنید.

انجام تحقیقات بازار در مورد روندهای مد اخلاقی

ساخت افزونه‌های مرورگر با تمرکز بر پایداری

نظارت بر تغییرات رتبه‌بندی برندها برای گزارش‌دهی ESG

تجمیع جایگزین‌های اخلاقی برای پلتفرم‌های خرده‌فروشی

تحقیقات دانشگاهی در مورد شفافیت شرکتی

چالش‌های اسکرپینگ

چالش‌های فنی که ممکن است هنگام اسکرپ Good On You با آنها مواجه شوید.

محافظت Cloudflare در صفحات نتایج جستجو

نیاز به رندر JavaScript برای بارگذاری رتبه‌بندی‌ها

سلکتورهای CSS پویا در بخش‌های جزئیات برند

محدودیت نرخ (Rate limits) در جستجوهای پرتکرار برندها

استخراج داده از Good On You با هوش مصنوعی

بدون نیاز به کدنویسی. با اتوماسیون مبتنی بر هوش مصنوعی در چند دقیقه داده استخراج کنید.

نحوه عملکرد

1

نیاز خود را توصیف کنید

به هوش مصنوعی بگویید چه داده‌هایی را می‌خواهید از Good On You استخراج کنید. فقط به زبان طبیعی بنویسید — بدون نیاز به کد یا سلکتور.

2

هوش مصنوعی داده‌ها را استخراج می‌کند

هوش مصنوعی ما Good On You را مرور می‌کند، محتوای پویا را مدیریت می‌کند و دقیقاً آنچه درخواست کرده‌اید را استخراج می‌کند.

3

داده‌های خود را دریافت کنید

داده‌های تمیز و ساختاریافته آماده برای صادرات به CSV، JSON یا ارسال مستقیم به برنامه‌های شما دریافت کنید.

چرا از هوش مصنوعی برای استخراج داده استفاده کنید

استخراج بدون کد (no-code) جداول پیچیده رتبه‌بندی
مدیریت خودکار پروفایل‌های برند رندر شده با JS
زمان‌بندی ابری برای به‌روزرسانی‌های هفتگی رتبه‌بندی
خروجی مستقیم به Google Sheets یا JSON
بدون نیاز به کارت اعتباریطرح رایگان موجودبدون نیاز به راه‌اندازی

هوش مصنوعی استخراج داده از Good On You را بدون نوشتن کد آسان می‌کند. پلتفرم ما با هوش مصنوعی می‌فهمد چه داده‌هایی می‌خواهید — فقط به زبان طبیعی توصیف کنید و هوش مصنوعی به طور خودکار استخراج می‌کند.

How to scrape with AI:
  1. نیاز خود را توصیف کنید: به هوش مصنوعی بگویید چه داده‌هایی را می‌خواهید از Good On You استخراج کنید. فقط به زبان طبیعی بنویسید — بدون نیاز به کد یا سلکتور.
  2. هوش مصنوعی داده‌ها را استخراج می‌کند: هوش مصنوعی ما Good On You را مرور می‌کند، محتوای پویا را مدیریت می‌کند و دقیقاً آنچه درخواست کرده‌اید را استخراج می‌کند.
  3. داده‌های خود را دریافت کنید: داده‌های تمیز و ساختاریافته آماده برای صادرات به CSV، JSON یا ارسال مستقیم به برنامه‌های شما دریافت کنید.
Why use AI for scraping:
  • استخراج بدون کد (no-code) جداول پیچیده رتبه‌بندی
  • مدیریت خودکار پروفایل‌های برند رندر شده با JS
  • زمان‌بندی ابری برای به‌روزرسانی‌های هفتگی رتبه‌بندی
  • خروجی مستقیم به Google Sheets یا JSON

اسکرپرهای وب بدون کد برای Good On You

جایگزین‌های کلیک و انتخاب برای اسکرپینگ مبتنی بر AI

چندین ابزار بدون کد مانند Browse.ai، Octoparse، Axiom و ParseHub می‌توانند به شما در اسکرپ Good On You بدون نوشتن کد کمک کنند. این ابزارها معمولاً از رابط‌های بصری برای انتخاب داده استفاده می‌کنند، اگرچه ممکن است با محتوای پویای پیچیده یا اقدامات ضد ربات مشکل داشته باشند.

گردش کار معمول با ابزارهای بدون کد

1
افزونه مرورگر را نصب کنید یا در پلتفرم ثبت‌نام کنید
2
به وب‌سایت هدف بروید و ابزار را باز کنید
3
عناصر داده‌ای مورد نظر را با کلیک انتخاب کنید
4
انتخابگرهای CSS را برای هر فیلد داده پیکربندی کنید
5
قوانین صفحه‌بندی را برای استخراج چندین صفحه تنظیم کنید
6
CAPTCHA را مدیریت کنید (اغلب نیاز به حل دستی دارد)
7
زمان‌بندی اجرای خودکار را پیکربندی کنید
8
داده‌ها را به CSV، JSON صادر کنید یا از طریق API متصل شوید

چالش‌های رایج

منحنی یادگیری

درک انتخابگرها و منطق استخراج زمان می‌برد

انتخابگرها خراب می‌شوند

تغییرات وب‌سایت می‌تواند کل جریان کار را خراب کند

مشکلات محتوای پویا

سایت‌های پر از JavaScript نیاز به راه‌حل‌های پیچیده دارند

محدودیت‌های CAPTCHA

اکثر ابزارها نیاز به مداخله دستی برای CAPTCHA دارند

مسدود شدن IP

استخراج تهاجمی می‌تواند منجر به مسدود شدن IP شما شود

اسکرپرهای وب بدون کد برای Good On You

چندین ابزار بدون کد مانند Browse.ai، Octoparse، Axiom و ParseHub می‌توانند به شما در اسکرپ Good On You بدون نوشتن کد کمک کنند. این ابزارها معمولاً از رابط‌های بصری برای انتخاب داده استفاده می‌کنند، اگرچه ممکن است با محتوای پویای پیچیده یا اقدامات ضد ربات مشکل داشته باشند.

گردش کار معمول با ابزارهای بدون کد
  1. افزونه مرورگر را نصب کنید یا در پلتفرم ثبت‌نام کنید
  2. به وب‌سایت هدف بروید و ابزار را باز کنید
  3. عناصر داده‌ای مورد نظر را با کلیک انتخاب کنید
  4. انتخابگرهای CSS را برای هر فیلد داده پیکربندی کنید
  5. قوانین صفحه‌بندی را برای استخراج چندین صفحه تنظیم کنید
  6. CAPTCHA را مدیریت کنید (اغلب نیاز به حل دستی دارد)
  7. زمان‌بندی اجرای خودکار را پیکربندی کنید
  8. داده‌ها را به CSV، JSON صادر کنید یا از طریق API متصل شوید
چالش‌های رایج
  • منحنی یادگیری: درک انتخابگرها و منطق استخراج زمان می‌برد
  • انتخابگرها خراب می‌شوند: تغییرات وب‌سایت می‌تواند کل جریان کار را خراب کند
  • مشکلات محتوای پویا: سایت‌های پر از JavaScript نیاز به راه‌حل‌های پیچیده دارند
  • محدودیت‌های CAPTCHA: اکثر ابزارها نیاز به مداخله دستی برای CAPTCHA دارند
  • مسدود شدن IP: استخراج تهاجمی می‌تواند منجر به مسدود شدن IP شما شود

نمونه کدها

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent': 'Mozilla/5.0'}
url = 'https://directory.goodonyou.eco/brand/patagonia'

def scrape_brand():
    try:
        response = requests.get(url, headers=headers)
        if response.status_code == 200:
            soup = BeautifulSoup(response.text, 'html.parser')
            name = soup.find('h1').text.strip()
            rating = soup.find('h6', string=lambda x: 'rating' in x.lower()).text
            print(f'Brand: {name}, Rating: {rating}')
    except Exception as e:
        print(f'Error: {e}')

scrape_brand()

زمان استفاده

بهترین گزینه برای صفحات HTML ایستا که محتوا در سمت سرور بارگذاری می‌شود. سریع‌ترین و ساده‌ترین روش وقتی رندر JavaScript لازم نیست.

مزایا

  • سریع‌ترین اجرا (بدون سربار مرورگر)
  • کمترین مصرف منابع
  • به راحتی با asyncio قابل موازی‌سازی
  • عالی برای API و صفحات ایستا

محدودیت‌ها

  • قادر به اجرای JavaScript نیست
  • در SPA و محتوای پویا ناموفق است
  • ممکن است با سیستم‌های ضد ربات پیچیده مشکل داشته باشد

How to Scrape Good On You with Code

Python + Requests
import requests
from bs4 import BeautifulSoup

headers = {'User-Agent': 'Mozilla/5.0'}
url = 'https://directory.goodonyou.eco/brand/patagonia'

def scrape_brand():
    try:
        response = requests.get(url, headers=headers)
        if response.status_code == 200:
            soup = BeautifulSoup(response.text, 'html.parser')
            name = soup.find('h1').text.strip()
            rating = soup.find('h6', string=lambda x: 'rating' in x.lower()).text
            print(f'Brand: {name}, Rating: {rating}')
    except Exception as e:
        print(f'Error: {e}')

scrape_brand()
Python + Playwright
from playwright.sync_api import sync_playwright

def run():
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=True)
        page = browser.new_page()
        page.goto('https://directory.goodonyou.eco/brand/nike')
        page.wait_for_selector('h1')
        data = {
            'name': page.locator('h1').inner_text(),
            'score': page.locator('div[class*="RatingText"]').first.inner_text()
        }
        print(data)
        browser.close()
run()
Python + Scrapy
import scrapy

class GoodOnYouSpider(scrapy.Spider):
    name = 'goy'
    start_urls = ['https://directory.goodonyou.eco/categories/fashion']

    def parse(self, response):
        for brand in response.css('a[class*="BrandCard"]'):
            yield {
                'name': brand.css('h5::text').get(),
                'url': response.urljoin(brand.attrib['href'])
            }
        next_pg = response.css('a[aria-label="Next page"]::attr(href)').get()
        if next_pg:
            yield response.follow(next_pg, self.parse)
Node.js + Puppeteer
const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://directory.goodonyou.eco/brand/adidas');
  const data = await page.evaluate(() => ({
    name: document.querySelector('h1').innerText,
    rating: document.querySelector('h6').innerText
  }));
  console.log(data);
  await browser.close();
})();

با داده‌های Good On You چه کارهایی می‌توانید انجام دهید

کاربردهای عملی و بینش‌ها از داده‌های Good On You را بررسی کنید.

افزونه خرید آگاهانه

یک پلاگین مرورگر که هنگام خرید کاربران از برندهای با رتبه پایین به آن‌ها هشدار داده و جایگزین‌های اخلاقی پیشنهاد می‌دهد.

نحوه پیاده‌سازی:

  1. 1اسکرپ کردن دیتابیس برندها و امتیازات کلی.
  2. 2نمایه‌سازی نام‌ها برای جستجوی سریع در یک افزونه Chrome.
  3. 3تطبیق URL فعال با نمایه‌ی برندها.
  4. 4نمایش یک پاپ‌آپ شامل رتبه‌بندی و ۳ رقیب با رتبه بالاتر.

از Automatio برای استخراج داده از Good On You و ساخت این برنامه‌ها بدون نوشتن کد استفاده کنید.

با داده‌های Good On You چه کارهایی می‌توانید انجام دهید

  • افزونه خرید آگاهانه

    یک پلاگین مرورگر که هنگام خرید کاربران از برندهای با رتبه پایین به آن‌ها هشدار داده و جایگزین‌های اخلاقی پیشنهاد می‌دهد.

    1. اسکرپ کردن دیتابیس برندها و امتیازات کلی.
    2. نمایه‌سازی نام‌ها برای جستجوی سریع در یک افزونه Chrome.
    3. تطبیق URL فعال با نمایه‌ی برندها.
    4. نمایش یک پاپ‌آپ شامل رتبه‌بندی و ۳ رقیب با رتبه بالاتر.
  • بنچمارک سرمایه‌گذاری ESG

    تحلیلگران پایداری از این داده‌ها برای مقایسه اظهارات شرکت‌ها با رتبه‌بندی‌های واقعی عملکرد اخلاقی استفاده می‌کنند.

    1. استخراج امتیازهای سیاره، مردم و حیوانات برای برندهای با ارزش بازار بالا.
    2. ادغام این داده‌ها با گزارش‌های مالی ESG.
    3. محاسبه ضریب همبستگی بین رتبه‌بندی‌ها و عملکرد سهام.
    4. تولید گزارش‌های ماهانه رهبری صنعت.
  • بازارچه مد پایدار

    پلتفرم‌های تجارت الکترونیک می‌توانند از رتبه‌بندی‌ها برای گلچین کردن خودکار مجموعه‌های 'خوب' یا 'عالی' استفاده کنند.

    1. هدف قرار دادن برندهایی با رتبه ۴ یا ۵ ستاره.
    2. استخراج محدوده محصولات و داده‌های موقعیت مکانی برند.
    3. استفاده از داده‌های اسکرپ شده برای پر کردن فیلتر اختصاصی 'برندهای اخلاقی'.
    4. به‌روزرسانی خودکار فیلترها با استفاده از اجرای هفتگی اسکرپر.
  • مانیتورینگ اعتبار برند

    شرکت‌های روابط عمومی تغییرات رتبه‌بندی را برای مدیریت تصویر برند و شناسایی شکاف‌های پایداری ردیابی می‌کنند.

    1. برنامه‌ریزی چک روزانه برای برندهای خاص مشتری و رقیب.
    2. تشخیص تغییرات در متن خلاصه اخلاقی یا رتبه‌بندی کلی.
    3. هشدار به ذینفعان هنگام بهبود یا افت رتبه‌بندی.
    4. تحلیل متن کیفی برای شکایات خاص کارگری یا محیط زیستی.
  • تحقیقات آکادمیک پایداری

    محققان می‌توانند با پردازش داده‌های تجمیعی هزاران برند، روندهای اخلاق در مد را تحلیل کنند.

    1. اسکرپ کردن کل دایرکتوری در تمام دسته‌بندی‌های مد.
    2. انجام تحلیل احساسات روی خلاصه‌های اخلاقی.
    3. ترسیم رتبه‌بندی‌ها در مقابل موقعیت‌های جغرافیایی برای یافتن روندهای منطقه‌ای.
    4. انتشار یافته‌ها درباره وضعیت شفافیت مد جهانی.
بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای اسکرپ Good On You

توصیه‌های تخصصی برای استخراج موفق داده از Good On You.

از یک مرورگر headless مانند Playwright برای مدیریت صحیح hydration در React استفاده کنید.

از residential proxies چرخشی استفاده کنید تا از تحریک سیستم تشخیص ربات Cloudflare جلوگیری شود.

یک بازه زمانی استراحت (sleep) تصادفی بین ۳ تا ۷ ثانیه تنظیم کنید تا رفتار مرور انسانی شبیه‌سازی شود.

فیلد 'Last Updated' را استخراج کنید تا چرخه به‌روزرسانی خود را بهینه کرده و در منابع صرفه‌جویی کنید.

روی صفحات دسته‌بندی خاص تمرکز کنید تا مدیریت pagination ساده‌تر شود.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط Web Scraping

سوالات متداول درباره Good On You

پاسخ سوالات رایج درباره Good On You را بیابید