هل كشط xkcd قانوني؟

نعم، يُسمح عموماً بكشط xkcd للاستخدام الشخصي أو غير التجاري. الموقع مرخص بموجب رخصة المشاع الإبداعي Attribution-NonCommercial 2.5، والتي تشجع على المشاركة وإعادة الاستخدام مع ذكر المصدر بشكل صحيح.

هل يمتلك xkcd واجهة API رسمية؟

نعم، يحتوي الموقع على واجهة JSON API بسيطة وفعالة للغاية. يمكنك الحصول على أحدث كوميك عبر https://xkcd.com/info.0.json أو واحد محدد عبر https://xkcd.com/[id]/info.0.json.

كيف يمكنني الحصول على نص الـ 'punchline'؟

يتم إخفاء الـ punchline في سمة 'title' لوسم الصورة (غالباً ما تسمى alt-text). عند كشط HTML، ابحث عن العنصر #comic img واستخرج سمة 'title'.

كم مرة يجب أن أقوم بالكشط للحصول على رسوم هزلية جديدة؟

يتم تحديث xkcd كل اثنين وأربعاء وجمعة. إعداد سكرابر مجدول للعمل مرة واحدة في تلك الأيام كافٍ للحفاظ على تحديث قاعدة بياناتك.

هل أحتاج إلى متصفح headless مثل Puppeteer؟

لا، يستخدم xkcd عرض HTML ثابت. أدوات بسيطة مثل Requests في Python أو حتى cURL كافية لاستخراج جميع البيانات المتاحة دون الحاجة إلى متصفح.

ما هي أفضل طريقة للتعامل مع الرسوم الهزلية 'الكبيرة'؟

بعض الرسوم الخاصة مثل #1110 تتكون من مئات المربعات الصغيرة. بالنسبة لهذه الرسوم، كشط البيانات الميتا (metadata) سهل، لكن إعادة بناء الصورة الكاملة تتطلب سكريبت متخصصاً لتجميع المربعات معاً.

هل يحظر xkcd عناوين IP بسبب الكشط؟

يعتبر xkcd صديقاً جداً لعمليات الكشط ونادراً ما يحظر عناوين IP. ومع ذلك، من اللباقة المهنية تعيين User-Agent وصفي وعدم الضغط على الخادم بمئات الطلبات في الثانية.

أين يمكنني العثور على النصوص (transcripts)؟

تتوفر النصوص عادةً ضمن استجابة JSON API في حقل 'transcript'. إذا كانت مفقودة في الموقع الرئيسي للرسوم القديمة، فإن ويكي 'Explain xkcd' يعد مصدراً ثانوياً ممتازاً.

كيفية كشط رسوم xkcd الهزلية: دليل API والويب سكرابينج

تعلم كيفية كشط البيانات الميتا لـ xkcd، والنصوص، وروابط الصور. استخدم واجهة JSON API الرسمية أو Python لأبحاث NLP والأرشفة دون اتصال بالإنترنت.

ابدأ التجريد مجاناً

ويب سكرابينج تحليل البيانات NLP أرشفة الصور بايثون

xkcd.comسهل

التغطية:Global

البيانات المتاحة6 حقول

العنوانالوصفالصورمعلومات البائعتاريخ النشرالسمات

جميع الحقول القابلة للاستخراج

رقم الكوميكعنوان الكوميكرابط الصورةالنص البديل (Punchline)النص الوصفي (Transcript)سنة النشرشهر النشريوم النشرالرابط الدائمحقل الأخبار/البيانات الميتا

المتطلبات التقنية

HTML ثابت

بدون تسجيل دخول

يحتوي على ترقيم صفحات

API رسمي متاح

عرض توثيق API

حول xkcd

اكتشف ما يقدمه xkcd وما هي البيانات القيمة التي يمكن استخراجها.

عالم xkcd

xkcd، الذي أنشأه Randall Munroe، هو كوميك ويب أسطوري يركز على الرومانسية، والسخرية، والرياضيات، واللغة. منذ إطلاقه في عام 2005، أصبح حجر زاوية في ثقافة الإنترنت، واشتهر برسومات الشخصيات الخطية والفكاهة الفكرية العميقة المتعلقة بالعلوم والتكنولوجيا.

البيانات المتاحة للاستخراج

يوفر الموقع إمكانية الوصول إلى أكثر من 2,800 كوميك. يحتوي كل إدخال على رقم كوميك فريد، وعنوان، ورابط صورة نسبي للبروتوكول، والـ 'alt-text' الشهير (الموجود في سمة عنوان الصورة) والذي غالباً ما يحتوي على الـ punchline النهائي. تتضمن معظم الرسوم أيضاً نصاً تفصيلياً (transcript).

لماذا يقوم الباحثون بكشط xkcd

يعد كشط هذه البيانات ذا قيمة عالية لـ معالجة اللغات الطبيعية (NLP) وتحليل المشاعر للفكاهة التقنية. توفر النصوص مجموعة بيانات نظيفة من الأوصاف البشرية، بينما يجعل الترقيم المتسلسل الموقع هدفاً مثالياً لممارسة الزحف على الويب وأتمتة الأرشفة.

لماذا تجريد xkcd؟

اكتشف القيمة التجارية وحالات الاستخدام لاستخراج البيانات من xkcd.

إنشاء أرشيف شامل أوفلاين لجميع الرسوم الهزلية العلمية.

إجراء تحليل مشاعر لثقافة الإنترنت على مدى عقدين.

تدريب نماذج machine learning على تحويل الصور إلى وصف نصي.

بناء فهرس مخصص وقابل للبحث لنصوص الكوميك للرجوع الأكاديمي.

تحليل الاتجاهات التاريخية في التكنولوجيا والبرمجة من خلال الفكاهة.

تطوير محرك توصية مخصص لـ 'Relevant xkcd'.

تحديات التجريد

التحديات التقنية التي قد تواجهها عند تجريد xkcd.

التعامل مع روابط الصور النسبية للبروتوكول (مثل //imgs.xkcd.com/) في الإدخالات القديمة.

تحليل التنسيق غير المتسق في النصوص للرسوم الصادرة قبل عام 2010.

إدارة حجم التخزين الإجمالي عند تنزيل أصول الصور عالية الدقة.

التعامل بسلاسة مع الرسوم 'الكبيرة' مثل 1110 التي تستخدم صوراً مجزأة.

استخرج بيانات xkcd بالذكاء الاصطناعي

لا حاجة للبرمجة. استخرج البيانات في دقائق مع الأتمتة المدعومة بالذكاء الاصطناعي.

كيف يعمل

صف ما تحتاجه

أخبر الذكاء الاصطناعي بالبيانات التي تريد استخراجها من xkcd. فقط اكتب بلغة طبيعية — لا حاجة لأكواد أو محددات.

الذكاء الاصطناعي يستخرج البيانات

ذكاؤنا الاصطناعي يتصفح xkcd، يتعامل مع المحتوى الديناميكي، ويستخرج بالضبط ما طلبته.

احصل على بياناتك

احصل على بيانات نظيفة ومنظمة جاهزة للتصدير كـ CSV أو JSON أو إرسالها مباشرة إلى تطبيقاتك.

لماذا تستخدم الذكاء الاصطناعي للاستخراج

واجهة بدون كود تتيح لغير المبرمجين استخراج الأرشيف بالكامل في دقائق.

التعامل التلقائي مع التنقل المتسلسل عبر هيكل روابط معرف الكوميك.

يمكن للتشغيل المجدول اكتشاف وكشط الرسوم الجديدة كل اثنين وأربعاء وجمعة.

التصدير المباشر من السحابة إلى قاعدة البيانات يلغي الحاجة إلى إدارة التخزين المحلي.

ابدأ الاستخراج مجاناً

لا حاجة لبطاقة ائتمانخطة مجانية متاحةلا حاجة لإعداد

أدوات تجريد الويب بدون كود لـxkcd

بدائل النقر والتأشير للتجريد المدعوم بالذكاء الاصطناعي

يمكن لعدة أدوات بدون كود مثل Browse.ai وOctoparse وAxiom وParseHub مساعدتك في تجريد xkcd بدون كتابة كود. تستخدم هذه الأدوات عادةً واجهات مرئية لتحديد البيانات، على الرغم من أنها قد تواجه صعوبة مع المحتوى الديناميكي المعقد أو إجراءات مكافحة البوتات.

سير العمل النموذجي مع أدوات بدون كود

تثبيت إضافة المتصفح أو التسجيل في المنصة

الانتقال إلى الموقع المستهدف وفتح الأداة

اختيار عناصر البيانات المراد استخراجها بالنقر

تكوين محددات CSS لكل حقل بيانات

إعداد قواعد التصفح لاستخراج صفحات متعددة

التعامل مع CAPTCHA (غالبًا يتطلب حلاً يدويًا)

تكوين الجدولة للتشغيل التلقائي

تصدير البيانات إلى CSV أو JSON أو الاتصال عبر API

التحديات الشائعة

منحنى التعلم

فهم المحددات ومنطق الاستخراج يستغرق وقتًا

المحددات تتعطل

تغييرات الموقع يمكن أن تكسر سير العمل بالكامل

مشاكل المحتوى الديناميكي

المواقع الغنية بـ JavaScript تتطلب حلولاً معقدة

قيود CAPTCHA

معظم الأدوات تتطلب تدخلاً يدويًا لـ CAPTCHA

حظر IP

الاستخراج المكثف قد يؤدي إلى حظر عنوان IP الخاص بك

أمثلة الكود

import requests
from bs4 import BeautifulSoup

def scrape_xkcd_page(comic_id):
    url = f'https://xkcd.com/{comic_id}/'
    headers = {'User-Agent': 'ScrapingGuideBot/1.0'}
    
    # Send request to the comic page
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        soup = BeautifulSoup(response.text, 'html.parser')
        
        # Extract the title and image metadata
        comic_div = soup.find(id='comic')
        img = comic_div.find('img')
        
        data = {
            'title': soup.find(id='ctitle').text,
            'img_url': 'https:' + img['src'],
            'alt_text': img['title']
        }
        return data

# Example: Scrape comic #1000
print(scrape_xkcd_page(1000))

متى تستخدم

الأفضل لصفحات HTML الثابتة مع حد أدنى من JavaScript. مثالي للمدونات ومواقع الأخبار وصفحات المنتجات البسيطة.

المزايا

●أسرع تنفيذ (بدون عبء المتصفح)
●أقل استهلاك للموارد
●سهل التوازي مع asyncio
●ممتاز لواجهات API والصفحات الثابتة

القيود

●لا يمكنه تنفيذ JavaScript
●يفشل في تطبيقات الصفحة الواحدة والمحتوى الديناميكي
●قد يواجه صعوبة مع أنظمة مكافحة البوتات المعقدة

from playwright.sync_api import sync_playwright

def scrape_with_playwright(comic_id):
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=True)
        page = browser.new_page()
        page.goto(f'https://xkcd.com/{comic_id}/')
        
        # Wait for the comic element to load
        page.wait_for_selector('#comic img')
        
        title = page.inner_text('#ctitle')
        img_src = page.get_attribute('#comic img', 'src')
        alt_text = page.get_attribute('#comic img', 'title')
        
        print(f'Comic {comic_id}: {title}')
        print(f'Alt Text: {alt_text}')
        
        browser.close()

scrape_with_playwright(2500)

متى تستخدم

مثالي للمواقع الكثيفة بـJavaScript وتطبيقات الصفحة الواحدة والصفحات التي تتطلب تفاعل المستخدم مثل التمرير اللانهائي أو نقرات الأزرار.

المزايا

●تنفيذ JavaScript كامل
●يتعامل مع المحتوى الديناميكي وتطبيقات الصفحة الواحدة
●آليات انتظار مدمجة
●دعم متعدد المتصفحات

القيود

●أبطأ من طلبات HTTP
●استخدام ذاكرة أعلى
●إعداد أكثر تعقيداً
●يمكن اكتشافه بواسطة أنظمة مكافحة البوتات

import scrapy

class XkcdSpider(scrapy.Spider):
    name = 'xkcd_spider'
    start_urls = ['https://xkcd.com/1/']

    def parse(self, response):
        yield {
            'num': response.url.split('/')[-2],
            'title': response.css('#ctitle::text').get(),
            'img_url': response.urljoin(response.css('#comic img::attr(src)').get()),
            'alt': response.css('#comic img::attr(title)').get()
        }

        # Follow the 'Next' button to crawl the entire archive
        next_page = response.css('a[rel="next"]::attr(href)').get()
        if next_page and next_page != '#':
            yield response.follow(next_page, self.parse)

متى تستخدم

مثالي لمشاريع التجريد واسعة النطاق التي تتطلب خطوط بيانات منظمة وبرمجيات وسيطة وزحف موزع.

المزايا

●جدولة وتقييد الطلبات المدمج
●نظام برمجيات وسيطة قوي
●تصدير لصيغ متعددة
●ممتاز للمشاريع واسعة النطاق

القيود

●منحنى تعلم حاد
●لا يدعم JavaScript بدون إضافات
●مبالغ فيه للمهام البسيطة

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://xkcd.com/614/');

  const comicData = await page.evaluate(() => {
    const img = document.querySelector('#comic img');
    return {
      title: document.querySelector('#ctitle').innerText,
      imgUrl: img.src,
      altText: img.title
    };
  });

  console.log(comicData);
  await browser.close();
})();

متى تستخدم

الأفضل لأتمتة Chrome المحددة وإنشاء PDF أو التقاط لقطات الشاشة. ممتاز للمواقع المحسنة لـChrome.

المزايا

●تكامل ممتاز مع Chrome DevTools
●ممتاز لإنشاء PDF ولقطات الشاشة
●دعم مجتمعي قوي
●جيد لميزات Chrome المحددة

القيود

●Chrome/Chromium فقط
●استهلاك موارد أعلى
●يمكن اكتشافه بواسطة أنظمة مكافحة البوتات
●أبطأ من الطرق القائمة على HTTP

كيفية استخراج بيانات xkcd بالكود

Python + Requests

import requests
from bs4 import BeautifulSoup

def scrape_xkcd_page(comic_id):
    url = f'https://xkcd.com/{comic_id}/'
    headers = {'User-Agent': 'ScrapingGuideBot/1.0'}
    
    # Send request to the comic page
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        soup = BeautifulSoup(response.text, 'html.parser')
        
        # Extract the title and image metadata
        comic_div = soup.find(id='comic')
        img = comic_div.find('img')
        
        data = {
            'title': soup.find(id='ctitle').text,
            'img_url': 'https:' + img['src'],
            'alt_text': img['title']
        }
        return data

# Example: Scrape comic #1000
print(scrape_xkcd_page(1000))

Python + Playwright

from playwright.sync_api import sync_playwright

def scrape_with_playwright(comic_id):
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=True)
        page = browser.new_page()
        page.goto(f'https://xkcd.com/{comic_id}/')
        
        # Wait for the comic element to load
        page.wait_for_selector('#comic img')
        
        title = page.inner_text('#ctitle')
        img_src = page.get_attribute('#comic img', 'src')
        alt_text = page.get_attribute('#comic img', 'title')
        
        print(f'Comic {comic_id}: {title}')
        print(f'Alt Text: {alt_text}')
        
        browser.close()

scrape_with_playwright(2500)

Python + Scrapy

import scrapy

class XkcdSpider(scrapy.Spider):
    name = 'xkcd_spider'
    start_urls = ['https://xkcd.com/1/']

    def parse(self, response):
        yield {
            'num': response.url.split('/')[-2],
            'title': response.css('#ctitle::text').get(),
            'img_url': response.urljoin(response.css('#comic img::attr(src)').get()),
            'alt': response.css('#comic img::attr(title)').get()
        }

        # Follow the 'Next' button to crawl the entire archive
        next_page = response.css('a[rel="next"]::attr(href)').get()
        if next_page and next_page != '#':
            yield response.follow(next_page, self.parse)

Node.js + Puppeteer

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://xkcd.com/614/');

  const comicData = await page.evaluate(() => {
    const img = document.querySelector('#comic img');
    return {
      title: document.querySelector('#ctitle').innerText,
      imgUrl: img.src,
      altText: img.title
    };
  });

  console.log(comicData);
  await browser.close();
})();

ماذا يمكنك فعله ببيانات xkcd

استكشف التطبيقات العملية والرؤى من بيانات xkcd.

تحليل المشاعر باستخدام NLP

يمكن للباحثين تحليل نصوص آلاف الرسوم الهزلية لمعرفة كيف تطور نبرة الفكاهة التقنية عبر العقود.

كيفية التنفيذ:

1استخراج النصوص والـ alt-text باستخدام JSON API.
2تقطيع النص (Tokenize) وإزالة كلمات التوقف القياسية.
3تطبيق محلل مشاعر مثل VADER أو TextBlob.
4تصور اتجاهات المشاعر بالنسبة لسنوات إصدار الكوميك.

استخدم Automatio لاستخراج البيانات من xkcd وبناء هذه التطبيقات بدون كتابة كود.

ماذا يمكنك فعله ببيانات xkcd

تحليل المشاعر باستخدام NLP
يمكن للباحثين تحليل نصوص آلاف الرسوم الهزلية لمعرفة كيف تطور نبرة الفكاهة التقنية عبر العقود.
1. استخراج النصوص والـ alt-text باستخدام JSON API.
2. تقطيع النص (Tokenize) وإزالة كلمات التوقف القياسية.
3. تطبيق محلل مشاعر مثل VADER أو TextBlob.
4. تصور اتجاهات المشاعر بالنسبة لسنوات إصدار الكوميك.
استخراج الكلمات المفتاحية التقنية
إنشاء قاعدة بيانات للمصطلحات التقنية المستخدمة بشكل متكرر في الثقافة الشعبية لتحديد الاتجاهات التكنولوجية الناشئة.
1. كشط جميع عناوين الرسوم الهزلية ونصوصها.
2. تحديد الكلمات المفتاحية العلمية والتقنية باستخدام نموذج NER.
3. حساب تردد الكلمات وكثافتها عبر العصور المختلفة للكوميك.
4. ربط هذه الكلمات المفتاحية بتواريخ إصدار التكنولوجيا في العالم الحقيقي (مثل Python 3، SpaceX).
تطبيق متصفح كوميك أوفلاين
يمكن للمطورين إنشاء تطبيقات صديقة للهاتف وتعمل دون اتصال بالإنترنت للمعجبين لقراءة الرسوم الهزلية دون الحاجة لاتصال.
1. كشط جميع روابط الصور والبيانات الميتا المرتبطة بها.
2. تنزيل الصور وضغطها لتحسين الأداء على الهاتف المحمول.
3. إنشاء قاعدة بيانات SQLite محلية تحتوي على العناوين والأرقام والـ alt-text.
4. بناء واجهة مستخدم تكشف عن الـ 'alt-text' عند الضغط المطول أو النقر.
تدريب الذكاء الاصطناعي على وصف الصور
استخدام الـ alt-text والنصوص الوصفية للغاية كمجموعة بيانات لتدريب نماذج machine learning على وصف المشاهد المعقدة.
1. تنزيل صور الكوميك والنصوص المقابلة لها.
2. تنظيف البيانات لإزالة فكاهة الـ 'punchline' غير الوصفية من النصوص.
3. استخدام أزواج (صورة-نص) لعمل fine-tuning لنموذج LLM multimodal.
4. تقييم قدرة النموذج على توليد فكاهة أو أوصاف تقنية.

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي

أتمتة الويب

سير عمل ذكي

ابدأ مجاناً

نصائح احترافية لتجريد xkcd

نصائح الخبراء لاستخراج البيانات بنجاح من xkcd.

تحقق دائماً من واجهة JSON API الرسمية عبر https

//xkcd.com/info.0.json أولاً؛ فهي أسرع بكثير من تحليل HTML.

عند كشط الصور، تأكد من إضافة 'https

' إلى سمة src، حيث غالباً ما يستخدم xkcd مسارات نسبية للبروتوكول (//imgs.xkcd.com).

احترم الخادم من خلال تحديد طلباتك بـ 1-2 طلب في الثانية؛ xkcd متساهل جداً ولكن التدفقات الكبيرة غير ضرورية.

استخدم 'الرابط الدائم' (Permanent Link) الموجود في أسفل كل صفحة لضمان عدم تعطل روابط قاعدة بياناتك إذا تغير هيكل الموقع.

إذا كنت بحاجة إلى تفسيرات أعمق للنكات، فكر في مراجعة ويكي مجتمع 'Explain xkcd'.

قم بتخزين معرف الكوميك كمفتاح أساسي (primary key) في قاعدة بياناتك للتعامل مع الطبيعة التسلسلية للبيانات بكفاءة.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة Web Scraping

الأسئلة الشائعة حول xkcd

ابحث عن إجابات للأسئلة الشائعة حول xkcd

كيفية كشط رسوم xkcd الهزلية: دليل API والويب سكرابينج

حول xkcd

عالم xkcd

البيانات المتاحة للاستخراج

لماذا يقوم الباحثون بكشط xkcd

لماذا تجريد xkcd؟

تحديات التجريد

استخرج بيانات xkcd بالذكاء الاصطناعي

كيف يعمل

لماذا تستخدم الذكاء الاصطناعي للاستخراج

How to scrape with AI:

Why use AI for scraping:

أدوات تجريد الويب بدون كود لـxkcd

سير العمل النموذجي مع أدوات بدون كود

التحديات الشائعة

أدوات تجريد الويب بدون كود لـxkcd

سير العمل النموذجي مع أدوات بدون كود

التحديات الشائعة

أمثلة الكود

كيفية استخراج بيانات xkcd بالكود

Python + Requests

Python + Playwright

Python + Scrapy

Node.js + Puppeteer

ماذا يمكنك فعله ببيانات xkcd

تحليل المشاعر باستخدام NLP

استخراج الكلمات المفتاحية التقنية

تطبيق متصفح كوميك أوفلاين

تدريب الذكاء الاصطناعي على وصف الصور

ماذا يمكنك فعله ببيانات xkcd

عزز سير عملك مع أتمتة الذكاء الاصطناعي

نصائح احترافية لتجريد xkcd

تحقق دائماً من واجهة JSON API الرسمية عبر https

عند كشط الصور، تأكد من إضافة 'https

ماذا يقول مستخدمونا

ذو صلة Web Scraping

How to Scrape GitHub | The Ultimate 2025 Technical Guide

How to Scrape Britannica: Educational Data Web Scraper

How to Scrape RethinkEd: A Technical Data Extraction Guide

How to Scrape Worldometers for Real-Time Global Statistics

How to Scrape Wikipedia: The Ultimate Web Scraping Guide

How to Scrape Pollen.com: Local Allergy Data Extraction Guide

How to Scrape Weather.com: A Guide to Weather Data Extraction

How to Scrape American Museum of Natural History (AMNH)

الأسئلة الشائعة حول xkcd

هل كشط xkcd قانوني؟

هل يمتلك xkcd واجهة API رسمية؟

كيف يمكنني الحصول على نص الـ 'punchline'؟

كم مرة يجب أن أقوم بالكشط للحصول على رسوم هزلية جديدة؟

هل أحتاج إلى متصفح headless مثل Puppeteer؟

ما هي أفضل طريقة للتعامل مع الرسوم الهزلية 'الكبيرة'؟

هل يحظر xkcd عناوين IP بسبب الكشط؟

أين يمكنني العثور على النصوص (transcripts)؟