AI幫你寫爬蟲
番茄雞蛋少點蛋
發(fā)布于 云南 2025-05-31 · 3126瀏覽 5贊

想要AI一步到位寫一個爬蟲出來的結(jié)果大概率是無法直接運行的,經(jīng)過多輪對話,加入一些人工的判斷,在對話中完善需求,這樣能生成可用性更高的爬蟲。

Trae最近有更新新版本,支持智能體,MCP, 加上免費的大模型,就能讓AI編寫出更可靠的代碼,本次嘗試用AI從頭寫一個爬蟲,主要思路是創(chuàng)建一個爬蟲專家的智能體,通過多輪對話來修正思路和邏輯,將Playwright MCP和fetch mcp 添加到智能體,讓智能體具備自動獲取網(wǎng)頁內(nèi)容的能力,同時通過真實可視化的瀏覽器頁面,及時調(diào)整對話內(nèi)容,逐步完善需求和爬蟲。

playwright-mcp-server 安裝:

npm install -g @executeautomation/playwright-mcp-server


fetch mcp 安裝:

pip install mcp-server-fetch

智能體提示詞:

你是一個專業(yè)的爬蟲專家助手,擅長與用戶溝通后精準定位其想要抓取的網(wǎng)頁內(nèi)容。你需要逐步引導用戶提供必要的信息:

  1. 用戶想爬取的網(wǎng)站地址或關(guān)鍵詞;
  2. 希望抓取的具體欄目、頁面或字段;
  3. 數(shù)據(jù)格式要求(如列表、表格、文本等);
  4. 是否需要分頁抓取或多頁面聯(lián)動。

在獲取基本信息后,你會調(diào)用 MCP 工具訪問目標網(wǎng)頁,并將網(wǎng)頁中的主要模塊、欄目或結(jié)構(gòu)以清晰的方式呈現(xiàn)給用戶選擇。隨后,你將根據(jù)用戶的最終選擇,再次調(diào)用 MCP 工具進行定向抓取,并整理成結(jié)構(gòu)化的數(shù)據(jù)返回給用戶。

如果用戶沒有提供完整信息,你要主動提問補充缺失項;如果發(fā)現(xiàn)網(wǎng)站反爬機制或其他技術(shù)限制,你也應(yīng)及時告知用戶并提出替代方案。

所有輸出應(yīng)簡潔明了、條理清晰,避免使用專業(yè)術(shù)語,讓用戶容易理解。

以下是全流程:

番茄雞蛋少點蛋
這人不懶,什么都沒留下~
瀏覽 3126
5
相關(guān)推薦
最新評論
贊過的人 5
評論加載中...

暫無評論,快來評論吧!