在 2025 年 6 月 24 日台灣威力彩頭獎講落台中市西區(新聞),威力彩夢碎,大概是因為我的報明牌機器人沒做好所以才選不中頭獎(才怪)。
以下謹此紀錄實現 RAG 的一個專項聊天機器人。
*未來可能會繼續更新,如果有不符合功能的部分,那就是修改或移除了。
GitHub – lazyjerry/chat-secretary: 2025-06-24 的今天,威力彩累積 17.5億。就做了這個,一個用 AI 做的樂透小助手。
github.com2025-06-24 的今天,威力彩累積 17.5億。就做了這個,一個用 AI 做的樂透小助手。. Contribute to lazyjerry/chat-secretary development by creating an account on GitHub.
貼上一下功能:
- Telegram Bot 互動,支援樂透相關問題詢問。
- 自動判斷使用者輸入意圖(使用 AI intent detection)。
- 中文/英文翻譯(使用 OpenAI GPT-4o-mini)。
- 利用 Cloudflare AutoRAG 查詢樂透彩歷史資料庫,快速回覆查詢。
- 針對查詢結果自動翻譯回使用者語言(預設繁體中文)。
- 動作紀錄與使用統計,包含每月查詢次數與 OpenAI Token 用量。
- 支援白名單管理,限制可使用者範圍。
- 指令支援:
/start
、/help
等。
另外他能設定白名單,所以機器人只會給允許的帳號使用。


並且同步附上 deepwiki 連結:
lazyjerry/chat-secretary | DeepWiki
deepwiki.comDeepWiki provides up-to-date documentation you can talk to, for lazyjerry/chat-secretary. Think Deep Research for GitHub – powered by Devin.
—
原則上技術細節都寫在 README 上面,這邊負責寫感想心得這樣。我主要的目的是為了實作 RAG 的功能和測試 ChatGPT Desktop 控制 VS Code 的功能。RAG 部分參考了 OpenAI、AnythingLLM、gpt4All 與 Cloudflare 服務,最後選擇了使用 Cloudflare ,考慮的因素有:
- 放在雲端、整合方便
- AI 和我都熟悉技術結構
- 價格相對便宜
- Cloudflare 的 RAG 可選擇 embedding model
- 未來擴充或改寫比較方便
也有推力,包含了:
- Cloudflare RAG 還在測試階段,可能不穩定
- Cloudflare 目前僅支援 R2 的儲存庫,尚不支援 D1 等服務。
這個機器人主要實現在 Telegram 上,以 Cloudflare 實現, RAG 的技術其實很多 AI 服務都有,主要是 Cloudflare Worker 整合串接會相對方便,再來 Vibe Coding 也較熟悉方便。以結果來說,我認為如果要作統計功能,或是需要操作已經結構化的數據,應該還是採用機器計算的方式比較好。 AI 的創造力可能會造成不穩定的因素,這不太能夠應用在統計與數學功能上。 而 RAG 的向量資料庫,比較適合文字影像和語意分析等場景,可能在儲存與使用上,應該透過 RAG 和 MCP 或是中間有自動化流程來組合比較妥當。
簡單講就是賽道和設計的結構有問題。
ChatGPT Desktop 控制 VS Code 的功能在實務上還滿怪的,就像 ChatGPT Desktop 要開啟 Canvas 畫布總是不盡人意一樣,有時候會懷意自己是不是連話都說不清楚。時靈時不靈的,如果有機會應該要來看一下 OpenAI 相關的 prompt 工程教學才行。
這是一個 LM 的創意與機器固定規則之間的拉扯。我認為策略和結構會是以後程式設計師遇到的大課題,像是 7-11 店員一樣,要開始把各領域的 knowhow 包起來,還是得要更多工具幫助自己 loading 更小才行。
附上〈向量資料庫與關聯資料庫差異與應用場景〉:
一、比較表
比較項目 | 向量資料庫 | 關聯資料庫 |
---|---|---|
資料型態 | 高維向量(如 128 維、512 維、1024 維) | 結構化資料(表格、行列) |
儲存內容 | 向量表示(embedding),來自文本、影像、聲音等 | 傳統業務資料,如使用者資料、訂單、產品等 |
查詢方式 | 相似度搜尋(Nearest Neighbor Search, ANN) | 精確查詢(SQL)基於條件過濾 |
索引技術 | 專門近似鄰居搜尋索引(如 HNSW、IVF、PQ) | B-tree、Hash 索引等 |
擴充性 | 擅長大規模非結構化高維資料的快速搜尋 | 擅長複雜關聯查詢和交易型應用 |
一致性與交易 | 通常不保證 ACID 交易 | 完整 ACID 支援,適合金融、電商等核心系統 |
典型應用場景 | 文字搜尋、影像搜尋、推薦系統、語意分析 | ERP、CRM、電商訂單管理、財務系統 |
優勢 | 處理語義相似度與非結構化資料,支持模糊搜尋 | 結構化資料管理、複雜查詢、多表關聯 |
缺點 | 不適合複雜交易與結構化關聯資料查詢 | 不擅長處理非結構化大規模向量資料 |
二、詳細說明
向量資料庫
- 用途:處理 AI 模型生成的向量化資料,如 NLP、影像辨識。
- 應用範例:
- 搜尋引擎:語意搜尋文章或問題。
- 電商推薦:根據用戶行為向量推薦商品。
- 聊天機器人:匹配相似對話內容。
- 技術代表:
- Milvus、Pinecone、Weaviate、FAISS(Facebook AI Similarity Search)
關聯資料庫
- 用途:管理結構化數據及其關聯。
- 應用範例:
- 電商平台:商品與訂單管理。
- 企業系統:財務、人事資料管理。
- 用戶管理與權限控管。
- 技術代表:
- MySQL、PostgreSQL、Oracle Database、SQL Server