كيفية كشط OnTheMarket | أداة كشط ويب OnTheMarket

تعرف على كيفية كشط OnTheMarket لاستخراج قوائم العقارات في المملكة المتحدة والأسعار وبيانات الوكلاء. دليل أساسي لمستثمري العقارات ومحللي السوق.

التغطية:United Kingdom
البيانات المتاحة10 حقول
العنوانالسعرالموقعالوصفالصورمعلومات البائعمعلومات الاتصالتاريخ النشرالفئاتالسمات
جميع الحقول القابلة للاستخراج
عنوان العقارسعر الإدراجالعنوان الكاملالرمز البريدي (Postcode)نوع العقارعدد غرف النومعدد الحماماتنوع الحيازة (Freehold/Leasehold)سنوات الإيجار المتبقيةمساحة الأرضية (قدم مربع/متر مربع)اسم الوكيلرقم هاتف الوكيلURL الإدراجURL الصورة الرئيسيةنص الوصفالمسافة لأقرب محطةتاريخ الإضافةحالة Only With Us
المتطلبات التقنية
JavaScript مطلوب
بدون تسجيل دخول
يحتوي على ترقيم صفحات
لا يوجد API رسمي
تم اكتشاف حماية ضد البوتات
CloudflareCloudFrontRate LimitingIP BlockingreCAPTCHA

تم اكتشاف حماية ضد البوتات

Cloudflare
جدار حماية تطبيقات الويب وإدارة البوتات على مستوى المؤسسات. يستخدم تحديات JavaScript وCAPTCHA وتحليل السلوك. يتطلب أتمتة المتصفح بإعدادات التخفي.
CloudFront
تحديد معدل الطلبات
يحد من الطلبات لكل IP/جلسة عبر الوقت. يمكن تجاوزه بالبروكسيات الدوارة وتأخير الطلبات والاستخراج الموزع.
حظر IP
يحظر عناوين IP المعروفة لمراكز البيانات والعناوين المُعلَّمة. يتطلب بروكسيات سكنية أو محمولة للتجاوز الفعال.
Google reCAPTCHA
نظام CAPTCHA من جوجل. الإصدار 2 يتطلب تفاعل المستخدم، والإصدار 3 يعمل بصمت مع تقييم المخاطر. يمكن حله بخدمات CAPTCHA.

حول OnTheMarket

اكتشف ما يقدمه OnTheMarket وما هي البيانات القيمة التي يمكن استخراجها.

نظرة عامة على السوق

OnTheMarket هي بوابة عقارات رائدة في المملكة المتحدة، تم إطلاقها في عام 2015 وتملكها حالياً CoStar Group بحصة أغلبية. تعمل كمنصة حيوية لوكلاء العقارات لإدراج العقارات السكنية والتجارية للبيع والإيجار في جميع أنحاء المملكة المتحدة. الموقع هو منافس رئيسي لـ Rightmove وZoopla، ويتميز بشروط إدراج فريدة.

توفر البيانات

تستضيف المنصة مستودعاً ضخماً من معلومات العقارات المهيكلة، بما في ذلك أسعار الطلب، ومواصفات العقارات المفصلة، والصور عالية الدقة، ومخططات الطوابق. ميزة هامة هي ملصق "Only With Us"، حيث تظهر العقارات على OnTheMarket قبل 24 ساعة أو أكثر من إدراجها في البوابات الكبرى الأخرى، مما يوفر ميزة زمنية واضحة لجمع البيانات.

إمكانيات الكشط

بالنسبة لمحترفي العقارات والمستثمرين، يعد كشط هذه المنصة ذا قيمة عالية لـ تحليل السوق وتتبع الاتجاهات. الوصول إلى هذه البيانات على نطاق واسع يسمح بإنشاء نماذج تقييم آلية (AVMs)، ومراقبة المخزون التنافسي، وتحديد البائعين المتحمسين من خلال الكشف عن انخفاض الأسعار دون مجهود يدوي.

حول OnTheMarket

لماذا تجريد OnTheMarket؟

اكتشف القيمة التجارية وحالات الاستخدام لاستخراج البيانات من OnTheMarket.

المراقبة في الوقت الفعلي لقوائم 'Only With Us' الحصرية في المملكة المتحدة

تقييم العقارات بدقة والبحث عن فرص الاستثمار

ذكاء تنافسي لحصة وكالات العقارات في السوق

توليد العملاء المحتملين لخدمات النقل وتحسين المنازل

تتبع الأسعار التاريخية لتحديد البائعين المتحمسين

تجميع سمات العقارات لنماذج machine learning

تحديات التجريد

التحديات التقنية التي قد تواجهها عند تجريد OnTheMarket.

حماية قوية ضد البوتات عبر CloudFront وCloudflare

الاعتماد الكبير على رندرة JavaScript (React/Next.js)

تغييرات متكررة في أسماء فئات CSS الديناميكية وهيكل DOM

تحديد معدل الطلبات (rate limiting) الصارم وتتبع الجلسات بناءً على IP

منطق ترقيم صفحات معقد يتضمن parameters ديناميكية في URL

استخرج بيانات OnTheMarket بالذكاء الاصطناعي

لا حاجة للبرمجة. استخرج البيانات في دقائق مع الأتمتة المدعومة بالذكاء الاصطناعي.

كيف يعمل

1

صف ما تحتاجه

أخبر الذكاء الاصطناعي بالبيانات التي تريد استخراجها من OnTheMarket. فقط اكتب بلغة طبيعية — لا حاجة لأكواد أو محددات.

2

الذكاء الاصطناعي يستخرج البيانات

ذكاؤنا الاصطناعي يتصفح OnTheMarket، يتعامل مع المحتوى الديناميكي، ويستخرج بالضبط ما طلبته.

3

احصل على بياناتك

احصل على بيانات نظيفة ومنظمة جاهزة للتصدير كـ CSV أو JSON أو إرسالها مباشرة إلى تطبيقاتك.

لماذا تستخدم الذكاء الاصطناعي للاستخراج

يتجاوز مشكلات JavaScript وhydration المعقدة تلقائياً
يستخدم residential proxies سحابية لمنع حظر IP
يضمن الكشط المجدول رؤية القوائم المبكرة (24 ساعة) على الفور
إعداد بدون كود لاستخراج نتائج العقارات متعددة الصفحات
تكامل مباشر مع Google Sheets للتحليل في الوقت الفعلي
لا حاجة لبطاقة ائتمانخطة مجانية متاحةلا حاجة لإعداد

الذكاء الاصطناعي يجعل استخراج بيانات OnTheMarket سهلاً بدون كتابة أكواد. منصتنا المدعومة بالذكاء الاصطناعي تفهم البيانات التي تريدها — فقط صفها بلغة طبيعية والذكاء الاصطناعي يستخرجها تلقائياً.

How to scrape with AI:
  1. صف ما تحتاجه: أخبر الذكاء الاصطناعي بالبيانات التي تريد استخراجها من OnTheMarket. فقط اكتب بلغة طبيعية — لا حاجة لأكواد أو محددات.
  2. الذكاء الاصطناعي يستخرج البيانات: ذكاؤنا الاصطناعي يتصفح OnTheMarket، يتعامل مع المحتوى الديناميكي، ويستخرج بالضبط ما طلبته.
  3. احصل على بياناتك: احصل على بيانات نظيفة ومنظمة جاهزة للتصدير كـ CSV أو JSON أو إرسالها مباشرة إلى تطبيقاتك.
Why use AI for scraping:
  • يتجاوز مشكلات JavaScript وhydration المعقدة تلقائياً
  • يستخدم residential proxies سحابية لمنع حظر IP
  • يضمن الكشط المجدول رؤية القوائم المبكرة (24 ساعة) على الفور
  • إعداد بدون كود لاستخراج نتائج العقارات متعددة الصفحات
  • تكامل مباشر مع Google Sheets للتحليل في الوقت الفعلي

أدوات تجريد الويب بدون كود لـOnTheMarket

بدائل النقر والتأشير للتجريد المدعوم بالذكاء الاصطناعي

يمكن لعدة أدوات بدون كود مثل Browse.ai وOctoparse وAxiom وParseHub مساعدتك في تجريد OnTheMarket بدون كتابة كود. تستخدم هذه الأدوات عادةً واجهات مرئية لتحديد البيانات، على الرغم من أنها قد تواجه صعوبة مع المحتوى الديناميكي المعقد أو إجراءات مكافحة البوتات.

سير العمل النموذجي مع أدوات بدون كود

1
تثبيت إضافة المتصفح أو التسجيل في المنصة
2
الانتقال إلى الموقع المستهدف وفتح الأداة
3
اختيار عناصر البيانات المراد استخراجها بالنقر
4
تكوين محددات CSS لكل حقل بيانات
5
إعداد قواعد التصفح لاستخراج صفحات متعددة
6
التعامل مع CAPTCHA (غالبًا يتطلب حلاً يدويًا)
7
تكوين الجدولة للتشغيل التلقائي
8
تصدير البيانات إلى CSV أو JSON أو الاتصال عبر API

التحديات الشائعة

منحنى التعلم

فهم المحددات ومنطق الاستخراج يستغرق وقتًا

المحددات تتعطل

تغييرات الموقع يمكن أن تكسر سير العمل بالكامل

مشاكل المحتوى الديناميكي

المواقع الغنية بـ JavaScript تتطلب حلولاً معقدة

قيود CAPTCHA

معظم الأدوات تتطلب تدخلاً يدويًا لـ CAPTCHA

حظر IP

الاستخراج المكثف قد يؤدي إلى حظر عنوان IP الخاص بك

أدوات تجريد الويب بدون كود لـOnTheMarket

يمكن لعدة أدوات بدون كود مثل Browse.ai وOctoparse وAxiom وParseHub مساعدتك في تجريد OnTheMarket بدون كتابة كود. تستخدم هذه الأدوات عادةً واجهات مرئية لتحديد البيانات، على الرغم من أنها قد تواجه صعوبة مع المحتوى الديناميكي المعقد أو إجراءات مكافحة البوتات.

سير العمل النموذجي مع أدوات بدون كود
  1. تثبيت إضافة المتصفح أو التسجيل في المنصة
  2. الانتقال إلى الموقع المستهدف وفتح الأداة
  3. اختيار عناصر البيانات المراد استخراجها بالنقر
  4. تكوين محددات CSS لكل حقل بيانات
  5. إعداد قواعد التصفح لاستخراج صفحات متعددة
  6. التعامل مع CAPTCHA (غالبًا يتطلب حلاً يدويًا)
  7. تكوين الجدولة للتشغيل التلقائي
  8. تصدير البيانات إلى CSV أو JSON أو الاتصال عبر API
التحديات الشائعة
  • منحنى التعلم: فهم المحددات ومنطق الاستخراج يستغرق وقتًا
  • المحددات تتعطل: تغييرات الموقع يمكن أن تكسر سير العمل بالكامل
  • مشاكل المحتوى الديناميكي: المواقع الغنية بـ JavaScript تتطلب حلولاً معقدة
  • قيود CAPTCHA: معظم الأدوات تتطلب تدخلاً يدويًا لـ CAPTCHA
  • حظر IP: الاستخراج المكثف قد يؤدي إلى حظر عنوان IP الخاص بك

أمثلة الكود

import requests
from bs4 import BeautifulSoup

# OnTheMarket uses Cloudflare; standard requests often get 403 Forbidden
url = 'https://www.onthemarket.com/for-sale/property/london/'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36'
}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    soup = BeautifulSoup(response.text, 'html.parser')
    # Selectors may change; look for list items containing results
    listings = soup.select('li[id^="result-"]')
    for item in listings:
        price = item.select_one('a.text-xl').text.strip() if item.select_one('a.text-xl') else 'N/A'
        address = item.select_one('address').text.strip() if item.select_one('address') else 'N/A'
        print(f'Price: {price} | Address: {address}')
except Exception as e:
    print(f'Scraping failed: {e}')

متى تستخدم

الأفضل لصفحات HTML الثابتة مع حد أدنى من JavaScript. مثالي للمدونات ومواقع الأخبار وصفحات المنتجات البسيطة.

المزايا

  • أسرع تنفيذ (بدون عبء المتصفح)
  • أقل استهلاك للموارد
  • سهل التوازي مع asyncio
  • ممتاز لواجهات API والصفحات الثابتة

القيود

  • لا يمكنه تنفيذ JavaScript
  • يفشل في تطبيقات الصفحة الواحدة والمحتوى الديناميكي
  • قد يواجه صعوبة مع أنظمة مكافحة البوتات المعقدة

كيفية استخراج بيانات OnTheMarket بالكود

Python + Requests
import requests
from bs4 import BeautifulSoup

# OnTheMarket uses Cloudflare; standard requests often get 403 Forbidden
url = 'https://www.onthemarket.com/for-sale/property/london/'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36'
}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    soup = BeautifulSoup(response.text, 'html.parser')
    # Selectors may change; look for list items containing results
    listings = soup.select('li[id^="result-"]')
    for item in listings:
        price = item.select_one('a.text-xl').text.strip() if item.select_one('a.text-xl') else 'N/A'
        address = item.select_one('address').text.strip() if item.select_one('address') else 'N/A'
        print(f'Price: {price} | Address: {address}')
except Exception as e:
    print(f'Scraping failed: {e}')
Python + Playwright
from playwright.sync_api import sync_playwright

def scrape_otm():
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=True)
        # Use a stealth-like context
        context = browser.new_context(user_agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36')
        page = context.new_page()
        page.goto('https://www.onthemarket.com/for-sale/property/london/', wait_until='networkidle')
        
        # Wait for the results to hydrate
        page.wait_for_selector('li[id^="result-"]')
        
        listings = page.query_selector_all('li[id^="result-"]')
        for prop in listings:
            title = prop.query_selector('.text-sm.text-denim').inner_text()
            price = prop.query_selector('.text-xl.font-bold').inner_text()
            print({'title': title, 'price': price})
        
        browser.close()

scrape_otm()
Python + Scrapy
import scrapy

class OnTheMarketSpider(scrapy.Spider):
    name = 'otm'
    start_urls = ['https://www.onthemarket.com/for-sale/property/london/']

    def parse(self, response):
        # Targets the main listing container list items
        for item in response.css('li[id^="result-"]'):
            yield {
                'price': item.css('.text-xl.font-bold::text').get(),
                'address': item.css('address span::text').get(),
                'agency': item.css('img::attr(alt)').get(),
                'link': response.urljoin(item.css('a::attr(href)').get())
            }

        next_page = response.css('link[rel="next"]::attr(href)').get()
        if next_page:
            yield response.follow(next_page, self.parse)
Node.js + Puppeteer
const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch({ headless: true });
  const page = await browser.newPage();
  await page.setUserAgent('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36');
  await page.goto('https://www.onthemarket.com/for-sale/property/london/', { waitUntil: 'networkidle2' });

  const data = await page.evaluate(() => {
    return Array.from(document.querySelectorAll('li[id^="result-"]')).map(li => ({
      price: li.querySelector('.text-xl')?.innerText.trim(),
      address: li.querySelector('address')?.innerText.trim()
    }));
  });

  console.log(data);
  await browser.close();
})();

ماذا يمكنك فعله ببيانات OnTheMarket

استكشف التطبيقات العملية والرؤى من بيانات OnTheMarket.

البحث عن إيجارات عالية العائد في المملكة المتحدة

يمكن لمستثمري الشراء بغرض التأجير تحديد العقارات ذات العائد على الاستثمار (ROI) المرتفع من خلال مقارنة بيانات الإيجار والبيع.

كيفية التنفيذ:

  1. 1كشط قوائم البيع وقوائم الإيجار لنفس الرموز البريدية (postcodes).
  2. 2مطابقة أنواع العقارات وعدد غرف النوم لحساب العوائد.
  3. 3تحديد المناطق التي تكون فيها نسبة السعر إلى الإيجار هي الأكثر ملاءمة.
  4. 4تصفية قوائم 'Only With Us' لتأمين الصفقات قبل السوق الأوسع.

استخدم Automatio لاستخراج البيانات من OnTheMarket وبناء هذه التطبيقات بدون كتابة كود.

ماذا يمكنك فعله ببيانات OnTheMarket

  • البحث عن إيجارات عالية العائد في المملكة المتحدة

    يمكن لمستثمري الشراء بغرض التأجير تحديد العقارات ذات العائد على الاستثمار (ROI) المرتفع من خلال مقارنة بيانات الإيجار والبيع.

    1. كشط قوائم البيع وقوائم الإيجار لنفس الرموز البريدية (postcodes).
    2. مطابقة أنواع العقارات وعدد غرف النوم لحساب العوائد.
    3. تحديد المناطق التي تكون فيها نسبة السعر إلى الإيجار هي الأكثر ملاءمة.
    4. تصفية قوائم 'Only With Us' لتأمين الصفقات قبل السوق الأوسع.
  • تقارير مخزون السوق الآلية

    يمكن للمحللين تتبع عدد القوائم الجديدة مقابل العقارات المباعة لتحديد مدى نشاط السوق.

    1. إجراء كشط يومي للقوائم في المدن الرئيسية بالمملكة المتحدة.
    2. حساب عدد وسوم 'New' مقابل 'Sold STC' أو 'Under Offer'.
    3. حساب متوسط أيام العرض في السوق لمختلف فئات الأسعار.
    4. تصوير اتجاهات المخزون بمرور الوقت في لوحة بيانات (dashboard).
  • تحليل حصة الوكالات في السوق

    يمكن لوكلاء العقارات تتبع أحجام قوائم المنافسين لتعديل استراتيجيات التسويق المحلية الخاصة بهم.

    1. استخراج 'اسم الوكيل' من جميع القوائم في سلطة محلية محددة.
    2. تجميع البيانات لمعرفة الوكالة التي تمتلك أكبر عدد من القوائم.
    3. مراقبة استراتيجيات تسعير الوكالات وانخفاضات الأسعار القائمة على العمولات.
    4. تعديل حملات التواصل مع البائعين بناءً على أداء المنافسين.
  • API لتقييم Proptech

    يمكن للشركات الناشئة بناء أدوات تقييم باستخدام بيانات السوق الحية كمصدر تدريب أساسي.

    1. كشط بيانات القوائم التاريخية والحالية بما في ذلك المساحة المربعة.
    2. تنظيف البيانات ومعالجة القيم الشاذة في السعر أو الحجم.
    3. تدريب regression model للتنبؤ بقيم العقارات بناءً على السمات المحلية.
    4. تقديم تقديرات في الوقت الفعلي للمستخدمين عبر API خارجي.
أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي

نصائح احترافية لتجريد OnTheMarket

نصائح الخبراء لاستخراج البيانات بنجاح من OnTheMarket.

استهدف وسم السكريبت `__OTM_DATA__` في مصدر HTML للعثور على بيانات JSON نظيفة دون الحاجة لتحليل فئات CSS المعقدة.

استخدم residential proxies حصرياً؛ حيث يتم رصد عناوين IP الخاصة بمراكز البيانات فوراً بواسطة CloudFront.

قم دائماً بضبط شرط 'wait_until' في headless browsers للسماح لمكونات React بالقيام بعملية hydration بالكامل.

قم بكشط العقارات المصنفة بـ 'Only With Us' في الصباح الباكر للحصول على أسبقية لمدة 24 ساعة على البوابات الأخرى.

قم بتنفيذ فترات توقف (sleep) عشوائية بين 3 و10 ثوانٍ لمحاكاة سلوك التصفح البشري.

تحقق من حقل 'تاريخ الإضافة' (Date Added) لتجنب المعالجة المكررة في قاعدة بياناتك وتوفير bandwidth.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة Web Scraping

الأسئلة الشائعة حول OnTheMarket

ابحث عن إجابات للأسئلة الشائعة حول OnTheMarket