كيفية كشط بيانات جودة الهواء من IQAir

تعلم كيفية كشط مؤشر جودة الهواء (AQI) الفوري، وPM2.5، وبيانات الطقس من IQAir لمراقبة اتجاهات التلوث وبناء تطبيقات تركز على الصحة.

IQAir favicon
iqair.comصعب
التغطية:GlobalUnited StatesChinaIndiaEuropeSoutheast Asia
البيانات المتاحة8 حقول
العنوانالموقعالوصفالصورمعلومات البائعتاريخ النشرالفئاتالسمات
جميع الحقول القابلة للاستخراج
اسم المدينةالبلد/المنطقةمؤشر جودة الهواء (AQI)نوع الملوث الرئيسيتركيز PM2.5تركيز PM10درجة الحرارةالرطوبةسرعة الرياحالضغط الجويتوقعات جودة الهواء لمدة 7 أيامإحداثيات GPS للمحطةمؤشر AQI التاريخي بالساعةالتوصيات الصحيةبيانات خريطة الحرائق/الدخان
المتطلبات التقنية
JavaScript مطلوب
بدون تسجيل دخول
يحتوي على ترقيم صفحات
API رسمي متاح
تم اكتشاف حماية ضد البوتات
CloudflareBrowser FingerprintingRate LimitingIP BlockingJavaScript Challenges

تم اكتشاف حماية ضد البوتات

Cloudflare
جدار حماية تطبيقات الويب وإدارة البوتات على مستوى المؤسسات. يستخدم تحديات JavaScript وCAPTCHA وتحليل السلوك. يتطلب أتمتة المتصفح بإعدادات التخفي.
بصمة المتصفح
يحدد البوتات من خلال خصائص المتصفح: canvas وWebGL والخطوط والإضافات. يتطلب التزييف أو ملفات تعريف متصفح حقيقية.
تحديد معدل الطلبات
يحد من الطلبات لكل IP/جلسة عبر الوقت. يمكن تجاوزه بالبروكسيات الدوارة وتأخير الطلبات والاستخراج الموزع.
حظر IP
يحظر عناوين IP المعروفة لمراكز البيانات والعناوين المُعلَّمة. يتطلب بروكسيات سكنية أو محمولة للتجاوز الفعال.
تحدي JavaScript
يتطلب تنفيذ JavaScript للوصول إلى المحتوى. الطلبات البسيطة تفشل؛ يلزم متصفح بدون واجهة مثل Playwright أو Puppeteer.

حول IQAir

اكتشف ما يقدمه IQAir وما هي البيانات القيمة التي يمكن استخراجها.

المراقبة العالمية لجودة الهواء

IQAir هي شركة تكنولوجيا جودة هواء مقرها سويسرا، وتدير المنصة الأكثر شمولاً في العالم لتتبع تلوث الهواء العالمي. يقومون بتجميع البيانات من أكثر من 30,000 محطة مراقبة، بما في ذلك المستشعرات الحكومية الرسمية وشبكة AirVisual الخاصة بهم، مما يوفر خريطة عالمية فورية لصحة الهواء.

بيانات بيئية شاملة

توفر المنصة مقاييس مفصلة تشمل مؤشر جودة الهواء الأمريكي (AQI)، وتركيزات ملوثات محددة مثل PM2.5 وPM10 والأوزون (O3) وثاني أكسيد النيتروجين، جنباً إلى جنب مع البيانات الأرصاد الجوية مثل درجة الحرارة والرطوبة وسرعة الرياح. كما تتميز بتصنيفات خاصة بالمدن وتوصيات صحية بناءً على ظروف الهواء الحالية.

القيمة لعلوم البيانات والأبحاث

يعد كشط هذه البيانات ذا قيمة عالية للباحثين البيئيين ومخططي المدن ومطوري التكنولوجيا الصحية. فهو يسمح بتحليل اتجاهات التلوث على المدى الطويل، وتأثير جودة الهواء على الصحة العامة، والارتباط بين العوامل البيئية والمؤشرات الاقتصادية مثل قيمة العقارات أو حركة المشاة في مراكز البيع بالتجزئة.

حول IQAir

لماذا تجريد IQAir؟

اكتشف القيمة التجارية وحالات الاستخدام لاستخراج البيانات من IQAir.

مراقبة طفرات التلوث المحلية في الوقت الفعلي لإصدار تنبيهات الصحة العامة

إجراء دراسات بيئية طويلة المدى حول اتجاهات جودة الهواء في المناطق الحضرية

دمج بيانات AQI الحية في أنظمة المنزل الذكي وأنظمة HVAC المعتمدة على IoT

تحليل تأثير جودة الهواء على أسعار سوق العقارات المحلي

إنشاء ذكاء تنافسي للسوق للشركات العاملة في مجال تنقية الهواء

جمع مجموعات بيانات عالية الدقة للبحث الأكاديمي حول تغير المناخ

تحديات التجريد

التحديات التقنية التي قد تواجهها عند تجريد IQAir.

حماية Cloudflare المتقدمة التي تحظر حركة المرور غير الصادرة من المتصفح

تحميل البيانات الديناميكي حيث يتم حقن قيم AQI عبر JavaScript

تحديد معدل الطلبات القوي الذي يفعل اختبارات CAPTCHA عند زيارة المدن بشكل متكرر

محددات CSS المتداخلة والمعقدة لتفاصيل المحطات الفورية

التغييرات المتكررة في هيكل HTML لجداول تصنيف المدن

استخرج بيانات IQAir بالذكاء الاصطناعي

لا حاجة للبرمجة. استخرج البيانات في دقائق مع الأتمتة المدعومة بالذكاء الاصطناعي.

كيف يعمل

1

صف ما تحتاجه

أخبر الذكاء الاصطناعي بالبيانات التي تريد استخراجها من IQAir. فقط اكتب بلغة طبيعية — لا حاجة لأكواد أو محددات.

2

الذكاء الاصطناعي يستخرج البيانات

ذكاؤنا الاصطناعي يتصفح IQAir، يتعامل مع المحتوى الديناميكي، ويستخرج بالضبط ما طلبته.

3

احصل على بياناتك

احصل على بيانات نظيفة ومنظمة جاهزة للتصدير كـ CSV أو JSON أو إرسالها مباشرة إلى تطبيقاتك.

لماذا تستخدم الذكاء الاصطناعي للاستخراج

يتجاوز Cloudflare وبصمات المتصفح تلقائياً
تنفيذ JavaScript أصلي لالتقاط قيم AQI المحملة ديناميكياً
جدولة سحابية لمراقبة بيئية على مدار الساعة طوال أيام الأسبوع دون توقف
اختيار مرئي سهل للعناصر المعقدة مثل مخططات الطقس والخرائط
تكامل مباشر مع Google Sheets لتسجيل البيانات في الوقت الفعلي
لا حاجة لبطاقة ائتمانخطة مجانية متاحةلا حاجة لإعداد

الذكاء الاصطناعي يجعل استخراج بيانات IQAir سهلاً بدون كتابة أكواد. منصتنا المدعومة بالذكاء الاصطناعي تفهم البيانات التي تريدها — فقط صفها بلغة طبيعية والذكاء الاصطناعي يستخرجها تلقائياً.

How to scrape with AI:
  1. صف ما تحتاجه: أخبر الذكاء الاصطناعي بالبيانات التي تريد استخراجها من IQAir. فقط اكتب بلغة طبيعية — لا حاجة لأكواد أو محددات.
  2. الذكاء الاصطناعي يستخرج البيانات: ذكاؤنا الاصطناعي يتصفح IQAir، يتعامل مع المحتوى الديناميكي، ويستخرج بالضبط ما طلبته.
  3. احصل على بياناتك: احصل على بيانات نظيفة ومنظمة جاهزة للتصدير كـ CSV أو JSON أو إرسالها مباشرة إلى تطبيقاتك.
Why use AI for scraping:
  • يتجاوز Cloudflare وبصمات المتصفح تلقائياً
  • تنفيذ JavaScript أصلي لالتقاط قيم AQI المحملة ديناميكياً
  • جدولة سحابية لمراقبة بيئية على مدار الساعة طوال أيام الأسبوع دون توقف
  • اختيار مرئي سهل للعناصر المعقدة مثل مخططات الطقس والخرائط
  • تكامل مباشر مع Google Sheets لتسجيل البيانات في الوقت الفعلي

أدوات تجريد الويب بدون كود لـIQAir

بدائل النقر والتأشير للتجريد المدعوم بالذكاء الاصطناعي

يمكن لعدة أدوات بدون كود مثل Browse.ai وOctoparse وAxiom وParseHub مساعدتك في تجريد IQAir بدون كتابة كود. تستخدم هذه الأدوات عادةً واجهات مرئية لتحديد البيانات، على الرغم من أنها قد تواجه صعوبة مع المحتوى الديناميكي المعقد أو إجراءات مكافحة البوتات.

سير العمل النموذجي مع أدوات بدون كود

1
تثبيت إضافة المتصفح أو التسجيل في المنصة
2
الانتقال إلى الموقع المستهدف وفتح الأداة
3
اختيار عناصر البيانات المراد استخراجها بالنقر
4
تكوين محددات CSS لكل حقل بيانات
5
إعداد قواعد التصفح لاستخراج صفحات متعددة
6
التعامل مع CAPTCHA (غالبًا يتطلب حلاً يدويًا)
7
تكوين الجدولة للتشغيل التلقائي
8
تصدير البيانات إلى CSV أو JSON أو الاتصال عبر API

التحديات الشائعة

منحنى التعلم

فهم المحددات ومنطق الاستخراج يستغرق وقتًا

المحددات تتعطل

تغييرات الموقع يمكن أن تكسر سير العمل بالكامل

مشاكل المحتوى الديناميكي

المواقع الغنية بـ JavaScript تتطلب حلولاً معقدة

قيود CAPTCHA

معظم الأدوات تتطلب تدخلاً يدويًا لـ CAPTCHA

حظر IP

الاستخراج المكثف قد يؤدي إلى حظر عنوان IP الخاص بك

أدوات تجريد الويب بدون كود لـIQAir

يمكن لعدة أدوات بدون كود مثل Browse.ai وOctoparse وAxiom وParseHub مساعدتك في تجريد IQAir بدون كتابة كود. تستخدم هذه الأدوات عادةً واجهات مرئية لتحديد البيانات، على الرغم من أنها قد تواجه صعوبة مع المحتوى الديناميكي المعقد أو إجراءات مكافحة البوتات.

سير العمل النموذجي مع أدوات بدون كود
  1. تثبيت إضافة المتصفح أو التسجيل في المنصة
  2. الانتقال إلى الموقع المستهدف وفتح الأداة
  3. اختيار عناصر البيانات المراد استخراجها بالنقر
  4. تكوين محددات CSS لكل حقل بيانات
  5. إعداد قواعد التصفح لاستخراج صفحات متعددة
  6. التعامل مع CAPTCHA (غالبًا يتطلب حلاً يدويًا)
  7. تكوين الجدولة للتشغيل التلقائي
  8. تصدير البيانات إلى CSV أو JSON أو الاتصال عبر API
التحديات الشائعة
  • منحنى التعلم: فهم المحددات ومنطق الاستخراج يستغرق وقتًا
  • المحددات تتعطل: تغييرات الموقع يمكن أن تكسر سير العمل بالكامل
  • مشاكل المحتوى الديناميكي: المواقع الغنية بـ JavaScript تتطلب حلولاً معقدة
  • قيود CAPTCHA: معظم الأدوات تتطلب تدخلاً يدويًا لـ CAPTCHA
  • حظر IP: الاستخراج المكثف قد يؤدي إلى حظر عنوان IP الخاص بك

أمثلة الكود

import requests
from bs4 import BeautifulSoup

# ملاحظة: يستخدم IQAir حماية Cloudflare؛ قد يتم حظر طلبات requests البسيطة.
# يوضح هذا المثال الهيكل في حال تم تجاوز نظام الحماية.
url = 'https://www.iqair.com/usa/new-york/new-york-city'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36',
    'Accept-Language': 'en-US,en;q=0.9'
}

try:
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        soup = BeautifulSoup(response.text, 'html.parser')
        # عنوان المدينة غالباً ما يكون في h1
        city = soup.find('h1').text.strip() if soup.find('h1') else 'N/A'
        # قيم AQI عادة ما تكون داخل كلاسات حالة محددة
        print(f'City: {city}')
    else:
        print(f'Blocked by Cloudflare: {response.status_code}')
except Exception as e:
    print(f'Error: {e}')

متى تستخدم

الأفضل لصفحات HTML الثابتة مع حد أدنى من JavaScript. مثالي للمدونات ومواقع الأخبار وصفحات المنتجات البسيطة.

المزايا

  • أسرع تنفيذ (بدون عبء المتصفح)
  • أقل استهلاك للموارد
  • سهل التوازي مع asyncio
  • ممتاز لواجهات API والصفحات الثابتة

القيود

  • لا يمكنه تنفيذ JavaScript
  • يفشل في تطبيقات الصفحة الواحدة والمحتوى الديناميكي
  • قد يواجه صعوبة مع أنظمة مكافحة البوتات المعقدة

كيفية استخراج بيانات IQAir بالكود

Python + Requests
import requests
from bs4 import BeautifulSoup

# ملاحظة: يستخدم IQAir حماية Cloudflare؛ قد يتم حظر طلبات requests البسيطة.
# يوضح هذا المثال الهيكل في حال تم تجاوز نظام الحماية.
url = 'https://www.iqair.com/usa/new-york/new-york-city'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36',
    'Accept-Language': 'en-US,en;q=0.9'
}

try:
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        soup = BeautifulSoup(response.text, 'html.parser')
        # عنوان المدينة غالباً ما يكون في h1
        city = soup.find('h1').text.strip() if soup.find('h1') else 'N/A'
        # قيم AQI عادة ما تكون داخل كلاسات حالة محددة
        print(f'City: {city}')
    else:
        print(f'Blocked by Cloudflare: {response.status_code}')
except Exception as e:
    print(f'Error: {e}')
Python + Playwright
from playwright.sync_api import sync_playwright

def scrape_iqair_live():
    with sync_playwright() as p:
        # تشغيل المتصفح مع إعدادات تشبه وضع التخفي
        browser = p.chromium.launch(headless=True)
        context = browser.new_context(user_agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64)...')
        page = context.new_page()

        # الانتقال إلى صفحة مدينة محددة
        page.goto('https://www.iqair.com/usa/new-york/new-york-city', wait_until='networkidle')

        # الانتظار حتى يظهر عنصر قيمة AQI الديناميكي
        page.wait_for_selector('.aqi-value__value')

        # استخراج البيانات من DOM
        data = {
            'city': page.inner_text('h1'),
            'aqi': page.inner_text('.aqi-value__value'),
            'pollutant': page.inner_text('.pollutant-level-wrapper b'),
            'temp': page.inner_text('.weather__detail--temp')
        }

        print(data)
        browser.close()

if __name__ == '__main__':
    scrape_iqair_live()
Python + Scrapy
import scrapy

class IQAirRankingSpider(scrapy.Spider):
    name = 'iqair_spider'
    start_urls = ['https://www.iqair.com/world-air-quality-ranking']

    def parse(self, response):
        # استخراج البيانات من جدول التصنيف العالمي
        # ملاحظة: يحتاج Scrapy عادةً إلى برمجية وسيطة JS مثل scrapy-playwright لهذا الموقع
        for row in response.css('table.ranking__table tr'):
            yield {
                'rank': row.css('td.rank::text').get(),
                'city': row.css('a.city-name::text').get(),
                'aqi': row.css('td.aqi::text').get(),
                'country': row.css('span.country-name::text').get()
            }
Node.js + Puppeteer
const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch({ headless: true });
  const page = await browser.newPage();
  
  try {
    // محاكاة مستخدم حقيقي لتجنب الحظر الفوري
    await page.setUserAgent('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36...');
    await page.goto('https://www.iqair.com/usa/new-york/new-york-city', { waitUntil: 'networkidle2' });

    // التقاط المحتوى الديناميكي
    const result = await page.evaluate(() => {
      return {
        city: document.querySelector('h1')?.innerText,
        aqi: document.querySelector('.aqi-value__value')?.innerText,
        main_pollutant: document.querySelector('.pollutant-level-wrapper b')?.innerText
      };
    });

    console.log(result);
  } catch (err) {
    console.error('فشلت عملية الكشط:', err);
  } finally {
    await browser.close();
  }
})();

ماذا يمكنك فعله ببيانات IQAir

استكشف التطبيقات العملية والرؤى من بيانات IQAir.

تقييم الصحة العقارية

يمكن لمنصات العقارات استخدام بيانات جودة الهواء التاريخية لتقديم درجات صحية لأحياء محددة.

كيفية التنفيذ:

  1. 1كشط بيانات PM2.5 وAQI التاريخية لرموز بريدية محددة.
  2. 2حساب متوسط عدد الأيام 'غير الصحية' سنوياً.
  3. 3دمج هذه الدرجة في صفحات إدراج العقارات لإعلام المشترين.
  4. 4تحديث الدرجات ربع سنوياً لتعكس التغيرات الموسمية في التلوث.

استخدم Automatio لاستخراج البيانات من IQAir وبناء هذه التطبيقات بدون كتابة كود.

ماذا يمكنك فعله ببيانات IQAir

  • تقييم الصحة العقارية

    يمكن لمنصات العقارات استخدام بيانات جودة الهواء التاريخية لتقديم درجات صحية لأحياء محددة.

    1. كشط بيانات PM2.5 وAQI التاريخية لرموز بريدية محددة.
    2. حساب متوسط عدد الأيام 'غير الصحية' سنوياً.
    3. دمج هذه الدرجة في صفحات إدراج العقارات لإعلام المشترين.
    4. تحديث الدرجات ربع سنوياً لتعكس التغيرات الموسمية في التلوث.
  • تكامل المدن الذكية وIoT

    يمكن لمصنعي أجهزة المنزل الذكي أتمتة أجهزة تنقية الهواء الداخلية بناءً على مستويات التلوث الخارجية.

    1. إعداد كشط مجدول لمؤشر AQI للمدينة المحلية كل 15 دقيقة.
    2. دفع قيمة AQI الحية إلى قاعدة بيانات سحابية أو webhook.
    3. تفعيل أجهزة تنقية الهواء العاملة بنظام IoT لتعمل على الوضع العالي عندما يتجاوز AQI المحلي 100.
    4. إرسال تنبيهات عبر الهاتف للمستخدمين عندما يكون فتح النوافذ آمناً.
  • مراقبة مرضى الرعاية الصحية

    يمكن للعيادات المتخصصة في صحة الجهاز التنفسي تقديم تنبيهات مخصصة للمرضى الحساسين.

    1. جمع تركيزات الأوزون وPM10 الفورية لمواقع المرضى.
    2. مقارنة البيانات الحية بالمعايير الطبية لمرضى الربو أو الانسداد الرئوي المزمن.
    3. إرسال تنبيهات SMS تلقائية تنصح المرضى بالبقاء في الداخل.
    4. إنشاء تقارير أسبوعية للأطباء حول مستويات تعرض المرضى.
  • ذكاء سوق التجارة الإلكترونية

    يمكن لمصنعي أقنعة N95 وفلاتر الهواء تحسين الإنفاق الإعلاني بناءً على اتجاهات جودة الهواء.

    1. مراقبة 'تصنيف جودة الهواء العالمي' يومياً لتحديد بؤر التلوث الساخنة.
    2. تحليل الاتجاهات الموسمية للتنبؤ بوقت ذروة الطلب على الفلاتر.
    3. أتمتة زيادة عروض أسعار Google Ads في المدن التي يتجاوز فيها AQI 150.
    4. توجيه توزيع المخزون إلى المستودعات القريبة من أحداث التلوث المتوقعة.
أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي

نصائح احترافية لتجريد IQAir

نصائح الخبراء لاستخراج البيانات بنجاح من IQAir.

استخدم بروكسيات سكنية (residential proxies) عالية الجودة لتدوير عناوين IP وتجاوز الحظر القائم على السمعة في Cloudflare.

حدد استدعاءات API الداخلية في تبويب الشبكة (XHR) بالمتصفح لجلب بيانات JSON مباشرة بدلاً من تحليل HTML.

قم بتنفيذ تأخيرات عشوائية تتراوح بين 5 إلى 15 ثانية لمحاكاة التصفح البشري وتجنب تفعيل حدود معدل الطلبات (rate limits).

قم بعملية كشط البيانات في الليل أو خلال ساعات خارج الذروة بالنسبة للمنطقة الزمنية للمدينة المستهدفة لتقليل مخاطر الاكتشاف.

قم دائماً بضبط User-Agent واقعي وتضمين ترويسات Referer لجعل الطلبات تبدو شرعية.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة Web Scraping

الأسئلة الشائعة حول IQAir

ابحث عن إجابات للأسئلة الشائعة حول IQAir