কীভাবে Century 21 স্ক্র্যাপ করবেন: রিয়েল এস্টেট ডেটা এক্সট্রাকশন নির্দেশিকা

Century 21 থেকে লিস্টিং, মূল্য এবং এজেন্টের বিবরণ স্ক্র্যাপ করার পদ্ধতি শিখুন। উচ্চ-মূল্যের রিয়েল এস্টেট ডেটা এক্সট্রাকশনের জন্য Akamai এবং CloudFront বাইপাস...

Century 21 favicon
www.century21.comকঠিন
কভারেজ:USACanadaUnited KingdomFranceJapanAustraliaMexico
উপলব্ধ ডেটা10 ফিল্ড
শিরোনামমূল্যঅবস্থানবিবরণছবিবিক্রেতা তথ্যযোগাযোগ তথ্যপ্রকাশের তারিখবিভাগবৈশিষ্ট্য
সব এক্সট্রাক্টেবল ফিল্ড
প্রপার্টির শিরোনামলিস্টিং প্রাইসরাস্তার ঠিকানাশহররাজ্যজিপ কোডবেডরুমবাথরুমস্কয়ার ফুটেজলট সাইজনির্মাণের বছরপ্রপার্টির ধরনলিস্টিং এজেন্টের নামএজেন্টের ফোন নম্বরব্রোকারেজ অফিসMLS নম্বরপ্রপার্টি বিবরণইমেজ URL সমূহমার্কেটে থাকার দিনট্যাক্স হিস্ট্রি
প্রযুক্তিগত প্রয়োজনীয়তা
JavaScript প্রয়োজন
লগইন লাগবে না
পেজিনেশন আছে
অফিসিয়াল API নেই
এন্টি-বট প্রোটেকশন সনাক্ত হয়েছে
Akamai Bot ManagerCloudFrontreCAPTCHAIP BlockingRate Limiting

এন্টি-বট প্রোটেকশন সনাক্ত হয়েছে

Akamai Bot Manager
ডিভাইস ফিঙ্গারপ্রিন্টিং, আচরণ বিশ্লেষণ এবং মেশিন লার্নিং ব্যবহার করে উন্নত বট সনাক্তকরণ। সবচেয়ে পরিশীলিত অ্যান্টি-বট সিস্টেমগুলির মধ্যে একটি।
CloudFront
Google reCAPTCHA
Google-এর CAPTCHA সিস্টেম। v2-তে ব্যবহারকারীর ইন্টারঅ্যাকশন প্রয়োজন, v3 ঝুঁকি স্কোরিং সহ নীরবে চলে। CAPTCHA সেবা দিয়ে সমাধান করা যায়।
IP ব্লকিং
পরিচিত ডেটাসেন্টার IP এবং চিহ্নিত ঠিকানা ব্লক করে। কার্যকরভাবে বাইপাস করতে আবাসিক বা মোবাইল প্রক্সি প্রয়োজন।
রেট লিমিটিং
সময়ের সাথে IP/সেশন প্রতি অনুরোধ সীমিত করে। ঘূর্ণায়মান প্রক্সি, অনুরোধ বিলম্ব এবং বিতরিত স্ক্র্যাপিং দিয়ে বাইপাস করা যায়।

Century 21 সম্পর্কে

Century 21 কী অফার করে এবং কী মূল্যবান ডেটা বের করা যায় তা আবিষ্কার করুন।

গ্লোবাল রিয়েল এস্টেট লিডার

Century 21 Real Estate LLC হলো একটি আইকনিক রিয়েল এস্টেট ফ্র্যাঞ্চাইজি কোম্পানি যা ১৯৭১ সালে প্রতিষ্ঠিত হয়। Anywhere Real Estate-এর একটি সহযোগী প্রতিষ্ঠান হিসেবে, এটি ৮০টিরও বেশি দেশে ১৪,০০০-এরও বেশি স্বাধীন মালিকানাধীন অফিসের একটি বিশাল নেটওয়ার্ক পরিচালনা করে। এই প্ল্যাটফর্মটি আবাসিক, বাণিজ্যিক এবং লাক্সারি প্রপার্টি লিস্টিংয়ের জন্য একটি প্রাথমিক হাব হিসেবে কাজ করে।

সমৃদ্ধ প্রপার্টি ডেটাসেট

এই ওয়েবসাইটটিতে লিস্টিং প্রাইস, প্রপার্টি স্পেকস (বেডরুম, বাথরুম, স্কয়ার ফুটেজ), নেইবারহুড ডেমোগ্রাফিক্স এবং ঐতিহাসিক ট্যাক্স রেকর্ডসহ গভীরভাবে স্ট্রাকচার্ড তথ্য রয়েছে। এতে এজেন্ট এবং ব্রোকারেজের বিস্তারিত প্রোফাইলও রয়েছে, যার মধ্যে যোগাযোগের বিবরণ এবং অফিসের অবস্থান অন্তর্ভুক্ত থাকে, যা ইন্ডাসট্রি লিড তৈরির জন্য একটি সোনার খনি।

ডেটা সায়েন্টিস্টদের জন্য গুরুত্ব

বিনিয়োগকারী এবং প্রপটেক ডেভেলপারদের জন্য, ভ্যালুয়েশন মডেল তৈরি করা, মার্কেটের ট্রেন্ড ট্র্যাক করা এবং লিড ডিসকভারি অটোমেট করার জন্য Century 21 স্ক্র্যাপ করা অত্যন্ত গুরুত্বপূর্ণ। এই ডেটা এক্সট্রাক্ট করার মাধ্যমে ব্যবসায়িক প্রতিষ্ঠানগুলো প্রতিযোগিতামূলক সুবিধা অর্জন করতে পারে, ব্রোকারেজ পারফরম্যান্স মনিটর করতে পারে এবং রিয়েল-টাইমে উচ্চ-ফলনশীল বিনিয়োগের সুযোগ শনাক্ত করতে পারে।

Century 21 সম্পর্কে

কেন Century 21 স্ক্র্যাপ করবেন?

Century 21 থেকে ডেটা বের করার ব্যবসায়িক মূল্য এবং ব্যবহারের ক্ষেত্রগুলি আবিষ্কার করুন।

রিয়েল এস্টেট ভ্যালুয়েশন মডেল

হোম অ্যাপরাইজাল এবং মার্কেটের পূর্বাভাসের জন্য ভবিষ্যদ্বাণীমূলক মডেল তৈরি করতে বিপুল পরিমাণ ঐতিহাসিক এবং বর্তমান লিস্টিং ডেটা সংগ্রহ করুন।

বিনিয়োগ শনাক্তকরণ

দ্রুত অধিগ্রহণ বা ফ্লিপিংয়ের জন্য অবমূল্যায়িত প্রপার্টি শনাক্ত করতে রিয়েল-টাইমে মূল্যের হ্রাস এবং নতুন লিস্টিং মনিটর করুন।

মর্টগেজ এবং লোন লিড জেনারেশন

নতুন প্রপার্টি লিস্টিং ট্র্যাক করার মাধ্যমে নতুন বাড়ির মালিক বা বিক্রেতাদের শনাক্ত করুন যাদের ফাইন্যান্সিং বা ইন্স্যুরেন্স পরিষেবা প্রয়োজন।

প্রতিযোগীদের মার্কেট শেয়ার

স্থানীয় বাজারে আধিপত্য বুঝতে নির্দিষ্ট জিপ কোডগুলোতে কোন ব্রোকারেজ এবং এজেন্টরা সবচেয়ে বেশি লিস্টিং পাচ্ছে তা বিশ্লেষণ করুন।

হাইপার-লোকাল মার্কেট ট্রেন্ড

ক্লায়েন্টদের কেনার সেরা সময় সম্পর্কে পরামর্শ দিতে নেইবারহুড পর্যায়ে প্রতি স্কয়ার ফুট মূল্য এবং ইনভেন্টরি লেভেলের পরিবর্তন ট্র্যাক করুন।

স্ক্র্যাপিং চ্যালেঞ্জ

Century 21 স্ক্র্যাপ করার সময় আপনি যে প্রযুক্তিগত চ্যালেঞ্জগুলির মুখোমুখি হতে পারেন।

Akamai বট ডিফেন্স

Century 21 হেডলেস ব্রাউজার এবং অটোমেটেড স্ক্র্যাপিং স্ক্রিপ্ট শনাক্ত ও ব্লক করতে Akamai-এর উন্নত আচরণগত বিশ্লেষণ ব্যবহার করে।

ডায়নামিক কন্টেন্ট রেন্ডারিং

সাইটটি আধুনিক JavaScript ফ্রেমওয়ার্কের ওপর নির্ভর করে, যার অর্থ ডেটা স্ট্যাটিক HTML-এ থাকে না এবং এর জন্য পূর্ণ ব্রাউজার এক্সিকিউশন প্রয়োজন।

আগ্রেসিভ IP রেট লিমিটিং

একই IP ঠিকানা থেকে ঘনঘন রিকোয়েস্ট করলে তাৎক্ষণিক ব্লক বা CAPTCHA চ্যালেঞ্জ দেখা দেয়, যার জন্য আবাসিক প্রক্সি রোটেশন প্রয়োজন।

ভঙ্গুর CSS সিলেক্টর

ওয়েবসাইটের গঠন এবং ক্লাস নেম প্রায়ই আপডেট করা হয়, যার জন্য সেলফ-হিলিং ক্ষমতা বা শক্তিশালী লজিক সম্পন্ন স্ক্র্যাপার প্রয়োজন।

AI দিয়ে Century 21 স্ক্র্যাপ করুন

কোডিং প্রয়োজন নেই। AI-চালিত অটোমেশনের মাধ্যমে মিনিটে ডেটা এক্সট্র্যাক্ট করুন।

কিভাবে কাজ করে

1

আপনার প্রয়োজন বর্ণনা করুন

Century 21 থেকে কী ডেটা এক্সট্র্যাক্ট করতে চান তা AI-কে বলুন। শুধু স্বাভাবিক ভাষায় টাইপ করুন — কোনো কোড বা সিলেক্টর প্রয়োজন নেই।

2

AI ডেটা এক্সট্র্যাক্ট করে

আমাদের কৃত্রিম বুদ্ধিমত্তা Century 21 নেভিগেট করে, ডাইনামিক কন্টেন্ট হ্যান্ডেল করে এবং আপনি যা চেয়েছেন ঠিক তাই এক্সট্র্যাক্ট করে।

3

আপনার ডেটা পান

CSV, JSON হিসাবে এক্সপোর্ট করতে বা সরাসরি আপনার অ্যাপে পাঠাতে প্রস্তুত পরিষ্কার, স্ট্রাকচার্ড ডেটা পান।

স্ক্র্যাপিংয়ের জন্য কেন AI ব্যবহার করবেন

নো-কোড ভিজ্যুয়াল বিল্ডার: পয়েন্ট এবং ক্লিক করার মাধ্যমে Century 21 থেকে জটিল ডেটা এক্সট্রাক্ট করুন, যা কাস্টম Python বা Node.js ডেভেলপমেন্টের প্রয়োজনীয়তা দূর করে।
ইন-বিল্ট Akamai বাইপাস: অত্যাধুনিক অ্যান্টি-বট সিস্টেমের কাছে অদৃশ্য থাকতে Automatio স্বয়ংক্রিয়ভাবে ব্রাউজার ফিঙ্গারপ্রিন্ট এবং আচরণগত প্যাটার্ন পরিচালনা করে।
ডায়নামিক JS এক্সিকিউশন: টুলটি সমস্ত ডায়নামিক React কম্পোনেন্ট নিখুঁতভাবে রেন্ডার করে, যা নিশ্চিত করে যে এক্সট্রাকশনের সময় কোনো প্রপার্টি ডিটেইলস বা ইমেজ মিস হবে না।
অটোমেটেড ক্লাউড শিডিউলিং: আপনার প্রপার্টি স্ক্র্যাপারগুলোকে প্রতিদিন বা প্রতি ঘণ্টায় চালানোর জন্য শিডিউল করুন, যা সরাসরি আপনার ডেটাবেস বা Google Sheets-এ নতুন লিস্টিং সিঙ্ক করবে।
ইনফিনিট স্ক্রল এবং পেজিনেশন: Automatio কোনো অতিরিক্ত ঝামেলা ছাড়াই 'Load More' বাটন এবং ইনফিনিট স্ক্রলিং হ্যান্ডেল করে, যা হাজার হাজার লিস্টিং স্ক্র্যাপ করা সহজ করে তোলে।
ক্রেডিট কার্ড প্রয়োজন নেইবিনামূল্যে প্ল্যান উপলব্ধকোনো সেটআপ প্রয়োজন নেই

AI দিয়ে কোড না লিখেই Century 21 স্ক্র্যাপ করা সহজ। আমাদের কৃত্রিম বুদ্ধিমত্তা চালিত প্ল্যাটফর্ম বোঝে আপনি কী ডেটা চান — শুধু স্বাভাবিক ভাষায় বর্ণনা করুন এবং AI স্বয়ংক্রিয়ভাবে এক্সট্র্যাক্ট করে।

How to scrape with AI:
  1. আপনার প্রয়োজন বর্ণনা করুন: Century 21 থেকে কী ডেটা এক্সট্র্যাক্ট করতে চান তা AI-কে বলুন। শুধু স্বাভাবিক ভাষায় টাইপ করুন — কোনো কোড বা সিলেক্টর প্রয়োজন নেই।
  2. AI ডেটা এক্সট্র্যাক্ট করে: আমাদের কৃত্রিম বুদ্ধিমত্তা Century 21 নেভিগেট করে, ডাইনামিক কন্টেন্ট হ্যান্ডেল করে এবং আপনি যা চেয়েছেন ঠিক তাই এক্সট্র্যাক্ট করে।
  3. আপনার ডেটা পান: CSV, JSON হিসাবে এক্সপোর্ট করতে বা সরাসরি আপনার অ্যাপে পাঠাতে প্রস্তুত পরিষ্কার, স্ট্রাকচার্ড ডেটা পান।
Why use AI for scraping:
  • নো-কোড ভিজ্যুয়াল বিল্ডার: পয়েন্ট এবং ক্লিক করার মাধ্যমে Century 21 থেকে জটিল ডেটা এক্সট্রাক্ট করুন, যা কাস্টম Python বা Node.js ডেভেলপমেন্টের প্রয়োজনীয়তা দূর করে।
  • ইন-বিল্ট Akamai বাইপাস: অত্যাধুনিক অ্যান্টি-বট সিস্টেমের কাছে অদৃশ্য থাকতে Automatio স্বয়ংক্রিয়ভাবে ব্রাউজার ফিঙ্গারপ্রিন্ট এবং আচরণগত প্যাটার্ন পরিচালনা করে।
  • ডায়নামিক JS এক্সিকিউশন: টুলটি সমস্ত ডায়নামিক React কম্পোনেন্ট নিখুঁতভাবে রেন্ডার করে, যা নিশ্চিত করে যে এক্সট্রাকশনের সময় কোনো প্রপার্টি ডিটেইলস বা ইমেজ মিস হবে না।
  • অটোমেটেড ক্লাউড শিডিউলিং: আপনার প্রপার্টি স্ক্র্যাপারগুলোকে প্রতিদিন বা প্রতি ঘণ্টায় চালানোর জন্য শিডিউল করুন, যা সরাসরি আপনার ডেটাবেস বা Google Sheets-এ নতুন লিস্টিং সিঙ্ক করবে।
  • ইনফিনিট স্ক্রল এবং পেজিনেশন: Automatio কোনো অতিরিক্ত ঝামেলা ছাড়াই 'Load More' বাটন এবং ইনফিনিট স্ক্রলিং হ্যান্ডেল করে, যা হাজার হাজার লিস্টিং স্ক্র্যাপ করা সহজ করে তোলে।

Century 21 এর জন্য নো-কোড ওয়েব স্ক্র্যাপার

AI-চালিত স্ক্র্যাপিংয়ের পয়েন্ট-অ্যান্ড-ক্লিক বিকল্প

Browse.ai, Octoparse, Axiom এবং ParseHub এর মতো বিভিন্ন নো-কোড টুল কোড না লিখে Century 21 স্ক্র্যাপ করতে সাহায্য করতে পারে। এই টুলগুলি সাধারণত ডেটা সিলেক্ট করতে ভিজ্যুয়াল ইন্টারফেস ব্যবহার করে, যদিও জটিল ডায়নামিক কন্টেন্ট বা অ্যান্টি-বট ব্যবস্থায় সমস্যা হতে পারে।

নো-কোড টুলের সাথে সাধারণ ওয়ার্কফ্লো

1
ব্রাুজার এক্সটেনশন ইনস্টল করুন বা প্ল্যাটফর্মে নিবন্ধন করুন
2
লক্ষ্য ওয়েবসাইটে নেভিগেট করুন এবং টুলটি খুলুন
3
পয়েন্ট-এন্ড-ক্লিকে ডেটা এলিমেন্ট নির্বাচন করুন
4
প্রতিটি ডেটা ফিল্ডের জন্য CSS সিলেক্টর কনফিগার করুন
5
একাধিক পেজ স্ক্র্যাপ করতে পেজিনেশন নিয়ম সেট আপ করুন
6
CAPTCHA পরিচালনা করুন (প্রায়ই ম্যানুয়াল সমাধান প্রয়োজন)
7
স্বয়ংক্রিয় রানের জন্য শিডিউলিং কনফিগার করুন
8
CSV, JSON-এ ডেটা রপ্তানি করুন বা API-এর মাধ্যমে সংযোগ করুন

সাধারণ চ্যালেঞ্জ

শেখার বক্ররেখা

সিলেক্টর এবং এক্সট্রাকশন লজিক বুঝতে সময় লাগে

সিলেক্টর ভেঙে যায়

ওয়েবসাইটের পরিবর্তন পুরো ওয়ার্কফ্লো ভেঙে দিতে পারে

ডাইনামিক কন্টেন্ট সমস্যা

JavaScript-ভারী সাইটগুলোর জটিল সমাধান প্রয়োজন

CAPTCHA সীমাবদ্ধতা

বেশিরভাগ টুলের CAPTCHA-এর জন্য ম্যানুয়াল হস্তক্ষেপ প্রয়োজন

IP ব্লকিং

আক্রমণাত্মক স্ক্র্যাপিং আপনার IP ব্লক হতে পারে

Century 21 এর জন্য নো-কোড ওয়েব স্ক্র্যাপার

Browse.ai, Octoparse, Axiom এবং ParseHub এর মতো বিভিন্ন নো-কোড টুল কোড না লিখে Century 21 স্ক্র্যাপ করতে সাহায্য করতে পারে। এই টুলগুলি সাধারণত ডেটা সিলেক্ট করতে ভিজ্যুয়াল ইন্টারফেস ব্যবহার করে, যদিও জটিল ডায়নামিক কন্টেন্ট বা অ্যান্টি-বট ব্যবস্থায় সমস্যা হতে পারে।

নো-কোড টুলের সাথে সাধারণ ওয়ার্কফ্লো
  1. ব্রাুজার এক্সটেনশন ইনস্টল করুন বা প্ল্যাটফর্মে নিবন্ধন করুন
  2. লক্ষ্য ওয়েবসাইটে নেভিগেট করুন এবং টুলটি খুলুন
  3. পয়েন্ট-এন্ড-ক্লিকে ডেটা এলিমেন্ট নির্বাচন করুন
  4. প্রতিটি ডেটা ফিল্ডের জন্য CSS সিলেক্টর কনফিগার করুন
  5. একাধিক পেজ স্ক্র্যাপ করতে পেজিনেশন নিয়ম সেট আপ করুন
  6. CAPTCHA পরিচালনা করুন (প্রায়ই ম্যানুয়াল সমাধান প্রয়োজন)
  7. স্বয়ংক্রিয় রানের জন্য শিডিউলিং কনফিগার করুন
  8. CSV, JSON-এ ডেটা রপ্তানি করুন বা API-এর মাধ্যমে সংযোগ করুন
সাধারণ চ্যালেঞ্জ
  • শেখার বক্ররেখা: সিলেক্টর এবং এক্সট্রাকশন লজিক বুঝতে সময় লাগে
  • সিলেক্টর ভেঙে যায়: ওয়েবসাইটের পরিবর্তন পুরো ওয়ার্কফ্লো ভেঙে দিতে পারে
  • ডাইনামিক কন্টেন্ট সমস্যা: JavaScript-ভারী সাইটগুলোর জটিল সমাধান প্রয়োজন
  • CAPTCHA সীমাবদ্ধতা: বেশিরভাগ টুলের CAPTCHA-এর জন্য ম্যানুয়াল হস্তক্ষেপ প্রয়োজন
  • IP ব্লকিং: আক্রমণাত্মক স্ক্র্যাপিং আপনার IP ব্লক হতে পারে

কোড উদাহরণ

import requests
from bs4 import BeautifulSoup

# Headers to mimic a real browser to avoid simple blocks
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36',
    'Accept-Language': 'en-US,en;q=0.9',
    'Referer': 'https://www.century21.com/'
}

url = 'https://www.century21.com/real-estate/new-york-ny/LCNYNEWYORK/'

try:
    # Using a proxy is highly recommended for Century 21
    response = requests.get(url, headers=headers, timeout=30)
    response.raise_for_status()
    soup = BeautifulSoup(response.text, 'html.parser')

    # Example: Finding property price elements
    for card in soup.select('.property-card'):
        price = card.select_one('.property-price').text.strip()
        address = card.select_one('.property-address').text.strip()
        print(f'Price: {price} | Address: {address}')
except Exception as e:
    print(f'Failed to retrieve data: {e}')

কখন ব্যবহার করবেন

কম JavaScript সহ স্ট্যাটিক HTML পেজের জন্য সেরা। ব্লগ, নিউজ সাইট এবং সাধারণ ই-কমার্স প্রোডাক্ট পেজের জন্য আদর্শ।

সুবিধা

  • দ্রুততম এক্সিকিউশন (ব্রাউজার ওভারহেড নেই)
  • সর্বনিম্ন রিসোর্স ব্যবহার
  • asyncio দিয়ে সহজে প্যারালেলাইজ করা যায়
  • API এবং স্ট্যাটিক পেজের জন্য দুর্দান্ত

সীমাবদ্ধতা

  • JavaScript এক্সিকিউট করতে পারে না
  • SPA এবং ডায়নামিক কন্টেন্টে ব্যর্থ হয়
  • জটিল অ্যান্টি-বট সিস্টেমে সমস্যা হতে পারে

কোড দিয়ে Century 21 স্ক্র্যাপ করার উপায়

Python + Requests
import requests
from bs4 import BeautifulSoup

# Headers to mimic a real browser to avoid simple blocks
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36',
    'Accept-Language': 'en-US,en;q=0.9',
    'Referer': 'https://www.century21.com/'
}

url = 'https://www.century21.com/real-estate/new-york-ny/LCNYNEWYORK/'

try:
    # Using a proxy is highly recommended for Century 21
    response = requests.get(url, headers=headers, timeout=30)
    response.raise_for_status()
    soup = BeautifulSoup(response.text, 'html.parser')

    # Example: Finding property price elements
    for card in soup.select('.property-card'):
        price = card.select_one('.property-price').text.strip()
        address = card.select_one('.property-address').text.strip()
        print(f'Price: {price} | Address: {address}')
except Exception as e:
    print(f'Failed to retrieve data: {e}')
Python + Playwright
from playwright.sync_api import sync_playwright

def scrape_century21():
    with sync_playwright() as p:
        # Launching with a real browser profile to bypass detection
        browser = p.chromium.launch(headless=True)
        context = browser.new_context(user_agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36')
        page = context.new_page()
        
        # Navigate to a specific search result page
        page.goto('https://www.century21.com/real-estate/miami-fl/LCCAMIAMI/')
        
        # Wait for dynamic property cards to render
        page.wait_for_selector('.property-card')
        
        # Extracting data
        listings = page.query_selector_all('.property-card')
        for item in listings:
            price = item.query_selector('.property-price').inner_text()
            address = item.query_selector('.property-address').inner_text()
            print(f'Home: {price}, Location: {address}')
        
        browser.close()

scrape_century21()
Python + Scrapy
import scrapy

class Century21Spider(scrapy.Spider):
    name = 'century21'
    start_urls = ['https://www.century21.com/real-estate/los-angeles-ca/LCCALOSANGELES/']
    
    # Custom settings to handle anti-bot and pagination
    custom_settings = {
        'DOWNLOAD_DELAY': 2,
        'USER_AGENT': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36',
        'CONCURRENT_REQUESTS': 1
    }

    def parse(self, response):
        for card in response.css('.property-card'):
            yield {
                'price': card.css('.property-price::text').get().strip(),
                'address': card.css('.property-address::text').get().strip(),
                'beds': card.css('.property-beds strong::text').get(),
            }

        # Following pagination
        next_page = response.css('a.next-page::attr(href)').get()
        if next_page:
            yield response.follow(next_page, self.parse)
Node.js + Puppeteer
const puppeteer = require('puppeteer-extra');
const StealthPlugin = require('puppeteer-extra-plugin-stealth');
puppeteer.use(StealthPlugin());

(async () => {
  const browser = await puppeteer.launch({ headless: true });
  const page = await browser.newPage();
  
  // Using stealth to bypass Akamai/CloudFront
  await page.goto('https://www.century21.com/real-estate/san-francisco-ca/LCCASANFRANCISCO/');
  
  // Wait for React content to load
  await page.waitForSelector('.property-card');

  const data = await page.evaluate(() => {
    const cards = Array.from(document.querySelectorAll('.property-card'));
    return cards.map(el => ({
      price: el.querySelector('.property-price').innerText.trim(),
      address: el.querySelector('.property-address').innerText.trim()
    }));
  });

  console.log(data);
  await browser.close();
})();

Century 21 ডেটা দিয়ে আপনি কী করতে পারেন

Century 21 ডেটা থেকে ব্যবহারিক অ্যাপ্লিকেশন এবং অন্তর্দৃষ্টি অন্বেষণ করুন।

ভবিষ্যদ্বাণীমূলক মূল্যায়ন ইঞ্জিন

রিয়েল এস্টেট ডেভেলপাররা স্ক্র্যাপ করা ডেটা ব্যবহার করে এমন অ্যালগরিদম তৈরি করেন যা প্রপার্টির ভবিষ্যৎ মূল্যের পূর্বাভাস দিতে পারে।

কিভাবে বাস্তবায়ন করবেন:

  1. 1একটি অঞ্চলের বর্তমান এবং ঐতিহাসিক লিস্টিং প্রাইস স্ক্র্যাপ করুন।
  2. 2স্কয়ার ফুটেজ এবং স্থানীয় স্কুলের স্কোরের সাথে ক্রস-রেফারেন্স করুন।
  3. 3প্রপার্টির মূল্য বৃদ্ধির অনুমান করতে একটি machine learning model প্রশিক্ষণ দিন।

Century 21 থেকে ডেটা এক্সট্রাক্ট করতে এবং কোড না লিখে এই অ্যাপ্লিকেশনগুলি তৈরি করতে Automatio ব্যবহার করুন।

Century 21 ডেটা দিয়ে আপনি কী করতে পারেন

  • ভবিষ্যদ্বাণীমূলক মূল্যায়ন ইঞ্জিন

    রিয়েল এস্টেট ডেভেলপাররা স্ক্র্যাপ করা ডেটা ব্যবহার করে এমন অ্যালগরিদম তৈরি করেন যা প্রপার্টির ভবিষ্যৎ মূল্যের পূর্বাভাস দিতে পারে।

    1. একটি অঞ্চলের বর্তমান এবং ঐতিহাসিক লিস্টিং প্রাইস স্ক্র্যাপ করুন।
    2. স্কয়ার ফুটেজ এবং স্থানীয় স্কুলের স্কোরের সাথে ক্রস-রেফারেন্স করুন।
    3. প্রপার্টির মূল্য বৃদ্ধির অনুমান করতে একটি machine learning model প্রশিক্ষণ দিন।
  • ঋণদাতাদের জন্য লক্ষ্যযুক্ত মার্কেটিং

    মর্টগেজ ঋণদাতারা সেইসব বাড়ির মালিকদের শনাক্ত করতে পারেন যারা কেবল তাদের প্রপার্টি লিস্টিং করেছেন, যাতে তাদের রিফাইনান্সিং বা নতুন লোন প্যাকেজ অফার করা যায়।

    1. নতুন লিস্টিংয়ের জন্য প্রতিদিন Century 21 মনিটর করুন।
    2. মালিক/এজেন্টের যোগাযোগের বিবরণ এবং প্রপার্টির ধরন এক্সট্রাক্ট করুন।
    3. CRM ইন্টিগ্রেশনের মাধ্যমে আউটরিচ অটোমেট করুন।
  • প্রতিযোগিতামূলক ব্রোকারেজ বেঞ্চমার্কিং

    এজেন্সিগুলো তাদের নিজস্ব সেলস কৌশল উন্নত করতে তাদের প্রতিযোগীদের লিস্টিং পারফরম্যান্স বিশ্লেষণ করে।

    1. একটি শহরের সমস্ত প্রতিযোগী ব্রোকারেজের লিস্টিং সংখ্যা স্ক্র্যাপ করুন।
    2. লিস্টিংগুলো 'Under Contract'-এ যেতে কত সময় নেয় তা ট্র্যাক করুন।
    3. প্রতিযোগীদের সার্ভিস এরিয়ার গ্যাপগুলো শনাক্ত করুন।
  • রিটেইল সাইট নির্বাচন

    বাণিজ্যিক বিনিয়োগকারীরা স্থানীয় প্রপার্টির মূল্যের ওপর ভিত্তি করে নতুন রিটেইল স্টোরের জন্য সেরা অবস্থান খুঁজে পেতে এই ডেটা ব্যবহার করেন।

    1. নির্দিষ্ট জোনিং টাইপের বাণিজ্যিক লিস্টিং স্ক্র্যাপ করুন।
    2. স্থানীয় সচ্ছলতা পরিমাপ করতে কাছের আবাসিক প্রপার্টির মান বিশ্লেষণ করুন।
    3. অব্যবহৃত এলাকাগুলো খুঁজে পেতে লিস্টিং ডেনসিটি ম্যাপ করুন।
শুধু প্রম্পটের চেয়ে বেশি

আপনার ওয়ার্কফ্লো সুপারচার্জ করুন AI অটোমেশন দিয়ে

Automatio AI এজেন্ট, ওয়েব অটোমেশন এবং স্মার্ট ইন্টিগ্রেশনের শক্তি একত্রিত করে আপনাকে কম সময়ে আরও বেশি অর্জন করতে সাহায্য করে।

AI এজেন্ট
ওয়েব অটোমেশন
স্মার্ট ওয়ার্কফ্লো

Century 21 স্ক্র্যাপ করার জন্য প্রো টিপস

Century 21 থেকে সফলভাবে ডেটা বের করার জন্য বিশেষজ্ঞ পরামর্শ।

আবাসিক প্রক্সি ব্যবহার করুন

স্ট্যান্ডার্ড ডেটা সেন্টার IP সহজেই শনাক্ত করা যায় এবং ব্লক করা হয়; বাস্তব বাড়ির ব্যবহারকারীর অনুকরণ করতে উচ্চ-মানের আবাসিক প্রক্সি ব্যবহার করা আবশ্যক।

স্টিলথ ব্রাউজিং প্রয়োগ করুন

অটোমেশন টুল ব্যবহার করার সময়, হেডলেস ব্রাউজার ফ্ল্যাগগুলো লুকিয়ে রাখতে স্টিলথ প্লাগইন ব্যবহার করুন, যা Akamai এবং CloudFront চেক করে থাকে।

রিকোয়েস্টের গতি নিয়ন্ত্রণ করুন

উচ্চ-ফ্রিকোয়েন্সি স্ক্র্যাপিং এড়িয়ে চলুন। মানুষের ব্রাউজিং প্যাটার্ন সিমুলেট করতে রিকোয়েস্টের মধ্যে ২-১০ সেকেন্ডের র‍্যান্ডম ডিলে যোগ করুন।

XHR ট্রাফিক মনিটর করুন

অভ্যন্তরীণ JSON API রিকোয়েস্টগুলো খুঁজে পেতে নেটওয়ার্ক ট্যাব পরীক্ষা করুন; প্রায়ই ডেটা এমন এন্ডপয়েন্টের মাধ্যমে লোড হয় যা পার্স করা অনেক সহজ।

লেজি লোডিং হ্যান্ডেল করুন

অনেক লিস্টিং ডিটেইলস এবং ছবি কেবল স্ক্রল করার সময় লোড হয়; আপনার স্ক্র্যাপার যেন ডেটা লোড করার জন্য ধীরে ধীরে স্ক্রল করে তা নিশ্চিত করুন।

ইউজার-এজেন্ট রোটেট করুন

সহজ সিগনেচার ডিটেকশন এড়াতে সবসময় আধুনিক এবং বাস্তব জগতের ইউজার-এজেন্ট স্ট্রিংয়ের একটি পুলের মাধ্যমে রোটেট করুন।

প্রশংসাপত্র

আমাদের ব্যবহারকারীরা কী বলেন

হাজার হাজার সন্তুষ্ট ব্যবহারকারীদের সাথে যোগ দিন যারা তাদের ওয়ার্কফ্লো রূপান্তরিত করেছেন

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

সম্পর্কিত Web Scraping

Century 21 সম্পর্কে সাধারণ প্রশ্নাবলী

Century 21 সম্পর্কে সাধারণ প্রশ্নের উত্তর খুঁজুন