作者: Jerry Lin

  • 實作 js 函式庫包裝為 API 提供給後端呼叫

    實作 js 函式庫包裝為 API 提供給後端呼叫

    最近在想有滿多 js 實作資料處理的函式庫,於是想看有沒有 nodejs 或是相似的程式語言可以相容 js 實做包裝城後端,於是想到了用 Cloudflare Worker 服務來實作。

    我拿 iztro 這套服務來實作,我認為很適合包裝成 API 呼叫的功能有幾個特色:

    1. 以處理、整理資料為目的的服務。
    2. 不需要相依其他套件( e.g. jQuery)
    3. 產生的結果是一包字串(json, xml 等),或是能轉成 base64 的檔案字串。

    先附上 Github repo 。名字叫做「My Iztro Worker」,有夠隨便,哈。

    這個服務基於 Cloudflare Worker 實作,實作以下功能:

    • API 服務:接受包含生日、出生時間、性別等參數的 HTTP GET 請求,返回相應的紫微斗數資訊。
    • 使用說明頁面:當請求缺少必要參數時,返回一個包含 API 使用說明和測試表單的 HTML 頁面,方便使用者瞭解如何使用該 API。
    • 速率限制:為了防止濫用,對每個客戶端 IP 設置了每分鐘最多 10 次請求的限制。

    實作了一個 usage.js 頁面作為測試 form 表,並且使用 Worker 特有的功能實作呼叫頻率的限制;src/index.js 中可以依照原始套件的說明參考修改。

    部署方式請參考請參考原始碼的 README,我作了一個線上範例,視狀況可能會停用,且用且珍惜:


    同場加映,請 AI 協助生成實作 nodejs 的說明:

    將 JavaScript 函式庫包裝為 API,提供後端呼叫,是現代軟體開發中常見的需求。這種方法能夠將複雜的邏輯封裝起來,透過標準化的介面供其他應用程式或服務使用。以下是實作此項目的簡要流程:

    1. 選擇適當的執行環境: 首先,選擇一個適合執行 JavaScript 的環境。Node.js 是一個常見的選擇,因為它允許在伺服器端執行 JavaScript。此外,像 Cloudflare Workers 這樣的伺服器無關環境也提供了在邊緣節點執行 JavaScript 的能力。
    2. 建立專案結構: 為您的 API 建立一個新的專案目錄,並初始化專案:
       mkdir my-js-api
       cd my-js-api
       npm init -y

    這將建立一個包含預設設定的 package.json 檔案。

    1. 安裝相依套件: 根據您的需求,安裝必要的相依套件。例如,若您需要處理 HTTP 請求,可以安裝 Express.js:
       npm install express
    1. 撰寫 API 邏輯: 在專案目錄中,建立一個主檔案(例如 index.js),並撰寫處理 HTTP 請求的邏輯。以下是一個使用 Express.js 的簡單範例:
       const express = require('express');
       const app = express();
       const port = 3000;
    
       // 引入您的 JavaScript 函式庫
       const myLibrary = require('./myLibrary');
    
       app.use(express.json());
    
       app.post('/api/your-endpoint', (req, res) => {
         const input = req.body.input;
         const result = myLibrary.yourFunction(input);
         res.json({ result });
       });
    
       app.listen(port, () => {
         console.log(`API 伺服器正在 http://localhost:${port} 上運行`);
       });

    在這個範例中,我們建立了一個 POST 端點 /api/your-endpoint,接受 JSON 格式的請求,並使用 myLibrary 中的函式處理輸入。

    1. 測試 API: 在本機運行您的 API 伺服器,並使用工具(如 Postman)或命令列工具(如 curl)進行測試:
       curl -X POST http://localhost:3000/api/your-endpoint -H "Content-Type: application/json" -d '{"input": "your data"}'

    確保您的 API 能夠正確處理請求並返回預期的結果。

    1. 部署 API: 根據您的需求,將 API 部署到適當的環境中。例如,您可以將其部署到雲端服務提供商(如 AWS、Heroku)或使用 Docker 容器進行部署。
    2. 實作速率限制和安全性: 為了防止濫用,建議實作速率限制機制。此外,確保您的 API 僅允許授權的請求,並實作適當的驗證和授權機制。

    透過上述步驟,您可以將 JavaScript 函式庫包裝為 API,供後端系統呼叫,實現功能的模組化和重用性。

  • MacOS 上將指定資料夾內檔案繁體轉簡體

    MacOS 上將指定資料夾內檔案繁體轉簡體

    因為有案子需要簡繁轉換,除了精確的用詞轉換之外,需要先有一個初步的字體修改,以下提供 OpenCC + Python 作法,先說注意事項:

    1. Mac 上如果已經安裝 pyenv 工具,記得在指定資料夾內把 pyenv local 設定好,這次使用的 python 版本是 3.7.4 。
    2. 程式碼中需要設定 target_folder 和 file_extension 變數,作為資料夾路徑和要變更結尾的副檔名。如果有需求請更為從外部輸入。
    3. 使用 cmd 觸發執行,基本上就是一個工程師小工具。

    在 macOS 上,您可以使用腳本來批次將資料夾內指定副檔名的檔案從繁體中文轉為簡體中文。以下是解決方案的步驟:

    使用 Python 和 OpenCC

    我們將使用 Python 和 OpenCC 庫來完成繁簡轉換。

    1. 安裝必要工具

    1. 安裝 Python
      macOS 通常自帶 Python,但建議使用 Homebrew 安裝最新版: brew install python
    2. 安裝 OpenCC
      使用 pip 安裝 OpenCC: pip install opencc

    2. 建立批次轉換腳本

    以下是 Python 腳本範例:

    import os
    from opencc import OpenCC
    
    # 初始化 OpenCC
    cc = OpenCC('t2s')  # 繁體轉簡體配置
    
    # 設定目標資料夾路徑與副檔名
    target_folder = "/path/to/your/folder"  # 替換為您的資料夾路徑
    file_extension = ".txt"  # 指定需要處理的副檔名
    
    def convert_file_to_simplified(filepath):
        try:
            with open(filepath, 'r', encoding='utf-8') as f:
                content = f.read()
            # 進行繁簡轉換
            simplified_content = cc.convert(content)
            with open(filepath, 'w', encoding='utf-8') as f:
                f.write(simplified_content)
            print(f"轉換完成: {filepath}")
        except Exception as e:
            print(f"處理檔案時發生錯誤: {filepath},錯誤訊息: {e}")
    
    # 遍歷目標資料夾中的所有檔案
    for root, dirs, files in os.walk(target_folder):
        for file in files:
            if file.endswith(file_extension):
                full_path = os.path.join(root, file)
                convert_file_to_simplified(full_path)

    3. 執行腳本

    1. 將上述腳本存為 convert_to_simplified.py
    2. 使用終端機執行腳本: python3 convert_to_simplified.py

    4. 說明

    • 替換 target_folder 為您的資料夾路徑。
    • 如果處理其他副檔名,將 file_extension 的值改為相應的副檔名(例如 .md)。
    • 腳本會遍歷資料夾和子資料夾中的所有符合條件的檔案。

    使用者界面工具選擇

    如果您不熟悉編程,可以考慮使用支持繁簡轉換的文字編輯器,例如:

    • Sublime Text: 安裝相關插件進行批次轉換。
    • OpenCC GUI: 下載圖形化工具版本進行手動處理。

    以上。

  • 解決 PHP 的 dompdf 中文字體亂碼的方法

    解決 PHP 的 dompdf 中文字體亂碼的方法

    記錄一下一個之前解決過的問題。

    在使用 php 的 dompdf 會有中文字無法正確讀取的問題,這主要是字型的關係,官方有提供一個解決方法。

    先說什麼是 dompdf 請參考開源程式說明

    Dompdf 是一個 HTML 到 PDF 轉換器

    從本質上講,dompdf(主要)是一個用 PHP 編寫的、符合CSS 2.1 的HTML 佈局和渲染引擎。它是一個樣式驅動的渲染器:它將下載並讀取外部樣式表、內聯樣式標籤以及各個 HTML 元素的樣式屬性。它還支援大多數表現性 HTML 屬性。

    這是一個 PHP 的工具,有幾點注意:

    1. 如果需要連外部圖片的話需要開啟設定,關鍵字請找:isRemoteEnabled
    2. 圖片或是連結請用絕對路徑。
    3. 不是全支援 CSS 3
    4. 通常會指定紙張樣式,這塊 html 需要考慮平面印刷的特色才行。

    接下來讓 AI 說明,使用 dompdf 支援可使用中文字型的方法。


    要在 Dompdf 中正確顯示中文,您需要引入支援中文的字體。以下是詳細步驟:

    1. 安裝 Dompdf:如果尚未安裝,請使用 Composer 安裝 Dompdf:
       composer require dompdf/dompdf
    1. 下載 load_font.php 工具:從 Dompdf 的 utils 儲存庫下載 load_font.php,並將其放置在 vendor/dompdf/dompdf 目錄下,與 libsrc 目錄同級。
    2. 下載中文字體:取得支援中文的字體檔案(如 simsun.ttfmsyh.ttf),並將其放置在與 load_font.php 相同的目錄中。
    3. 修改 load_font.php:確保 load_font.php 正確載入自動加載器。
       // 確認以下路徑正確
       require_once "../../autoload.php";
    1. 安裝字體:在命令列中執行以下命令來安裝字體:
       php load_font.php 字體名稱 字體檔案.ttf

    例如,若字體名稱為 simsun,字體檔案為 simsun.ttf,則執行:

       php load_font.php simsun simsun.ttf
    1. 確認字體安裝成功:在 vendor/dompdf/dompdf/lib/fonts 目錄中,應該能看到新生成的字體檔案(如 simsun.ttfsimsun.ufm)。此外,檢查 installed-fonts.json 檔案,確認字體資訊已被記錄。
    2. 在 CSS 中引用字體:在您的 HTML 或 CSS 中,使用 @font-face 規則引用新安裝的字體,並在需要的地方設置 font-family
       @font-face {
           font-family: 'simsun';
           src: url('path/to/simsun.ttf') format('truetype');
       }
       body {
           font-family: 'simsun';
       }

    請確保 src 的路徑正確指向字體檔案的位置。

    1. 生成 PDF:在生成 PDF 的程式碼中,確保載入的 HTML 包含上述字體設定。以下是範例程式碼:
       use Dompdf\Dompdf;
       use Dompdf\Options;
    
       // 初始化 Dompdf
       $options = new Options();
       $options->set('isRemoteEnabled', true);
       $dompdf = new Dompdf($options);
    
       // 載入 HTML 內容
       $html = '<html><head><style>
       @font-face {
           font-family: "simsun";
           src: url("path/to/simsun.ttf") format("truetype");
       }
       body {
           font-family: "simsun";
       }
       </style></head><body>您的中文內容</body></html>';
       $dompdf->loadHtml($html);
    
       // 設定紙張大小和方向
       $dompdf->setPaper('A4', 'portrait');
    
       // 生成 PDF
       $dompdf->render();
    
       // 輸出 PDF
       $dompdf->stream('document.pdf');

    請確保 @font-face 中的 src 路徑在 HTML 中是可訪問的。

    按照上述步驟,您應該能夠在 Dompdf 中成功引入並使用中文字體,確保生成的 PDF 正確顯示中文內容。


    我在 Github 上弄了兩個頁面可以把他架設起來試試看,請點這裡

    同場加映,有時我們想找中文開源字型,請到這裡

    可以 filiter 你要的字型,點擊搜尋出來的字型後再點擊 「Get font」按鈕。

    在這裡可以從 Download all 中下載字型,也可以從 embed code 中找到字型的連結。

    舉例像是抓出來的這個:

    https://fonts.googleapis.com/css2?family=Noto+Sans+TC:[email protected]&family=Noto+Serif+TC:[email protected]&display=swap

    打開來會得到一串 @font-face 的 css 資料,除了可以引用以外,也可以從裡面複製處來使用。 以上!

  • 使用 NoteGPT 生成「京華城土地違法容積獎勵案」起訴書摘要

    使用 NoteGPT 生成「京華城土地違法容積獎勵案」起訴書摘要

    算是記錄一下歷史,先附上這件事情相關新聞連結,新聞是隨便抓的,最近被小白癡噴「假中立」這件事,提醒我最後要記得抱怨一下。

    而之所要製作摘要的起因,是因為在 2024-12-26 檢方偵結起訴,並且公布了一份起訴書,內文字非常多。政治人物又接近於偶像的角色會有非常多正反兩方立場,甚至是極端的聲音,我看到網路上有人酸館長看起訴書非常快這件事(原文之一,請參考),從健身房回來以後突然想到:「他一定是用 AI 摘要!」

    事實與否不重要,於是我嘗試將起訴書內容做成摘要看看,是不是和館長的觀點會相近?以下記錄操作步驟:

    首先我必須找原文,找到了 pdf 檔案(這裡),但把檔案直接丟進去的話 NoteGPT 會顯示抓不出文字,於是我嘗試找看有沒有文字檔。

    結果發現鏡新聞竟然有發完整原文的一篇新聞(這裡),不愧人稱鏡檢,他們真的很討厭柯文哲我猜。

    看得到文字之後,我用 js 把底下內文抓出來,先儲存成一個 txt 檔案(這裡),這份 txt 是直接採文字內容,所以分行什麼的都沒有,給電腦看的沒關係。

    將檔案丟進去 Google 的 NoteGPT 裡面,這裡做過幾次嘗試,先是如果單純以文字貼上的形式,字數會太多無法使用;如果是用雲端公開連結的話,會顯示抓不到資料,用 docx 檔案也會顯示抓不到的問題,我想應該是擷取的功能有些限制,最後純文字上傳,耗費 19 點得以產生摘要。

    有趣的是探索 NoteGPT 生整摘要的過程。先附上筆記截圖,有簡體字不喜的話可以先去睡:

    生成了三份內容,第一份是原始摘要總結,包含了 Summary, Highlights, Outline, Keywords. 第二份是樹狀圖,第三份是使用「法律文件總結助手」來生成,NoteGPT 有很多不同的角色提示詞,也可以自訂想要的提示詞,我資質駑鈍,所以先只用了這三個現成的產生。

    而 NoteGPT 也會有匯出和分享功能,匯出結果在這裡,分享連結請點這裡(需登入)。要注意如果是用匯出 pdf ,請記得先把背景調整成淺色系,如果是深色的話,匯出的字會是白色的,但 pdf 背景也是白色的就看不清楚,這應該算是 bug,笑死。

    我將使用過的所有資料和備份、截圖等都放在這裡:

    不知道這和館長看到的內容有沒有很像?我沒讀完全文,不敢發表評論。還是提醒一下 AI 摘要與重點可能會有各種狀況產生錯誤與誤解的地方,和新聞媒體不同的地方是,新聞亂報有人負責,有法可據,如果你把 AI 生成的東西當作你的東西,你就要承受 AI 出錯的代價,如果明知如此卻又故意隱瞞,就有欺騙的嫌疑了,請三思。

    最後認真想評論一下關於「假中立」的這種評價,都 2025 年了,還有人在講。 我認真思考了兩天,我想這應該是因為角色錯誤期待造成的問題,例如把單口喜劇/站立喜劇的表演當作是脫口秀,甚至研討會議題來看,或是把一般人發表的內容用新聞的標準來看。認真說,我覺得這是低級錯誤,我必須得要引以為戒,要覺查到自己有期待錯誤的問題才行。

    當然情緒上沒有那麼 peace,剛在健身房做 facepull 到一半就突然想到:以後看到誰在那邊說 「xxx 假中立」我就回「沒錯~你最中立」按讚分享追蹤,盯著他,爬蟲抓他發文。他媽的但凡他發表任何一個觀點就把他的中立立場抓出來鞭。

    想想就刺激,馬上再多做一組。

  • 協助你在社群網站貼標籤的外掛「My Notes Extension 社群標籤」

    協助你在社群網站貼標籤的外掛「My Notes Extension 社群標籤」

    之前在想社群不知道有沒有一種幫助你把覺得怪的人標記起來的工具(參考),於是想到好像可以來做一個。越想越歪,果然水能載舟亦能覆舟,怎麼看怎麼像是操作議題的網軍在用的貼標籤工具。

    要先講一下原始的目的:


    為什麼要開發這個擴充套件?

    在當今的社群網路環境中,使用者常因觀點不合而選擇封鎖其他帳號,這種做法雖能暫時避免衝突,但也同時削弱了資訊來源的多樣性和豐富性。此外,網路上存在許多假冒帳號或有組織的網軍,他們散播極端言論、仇恨言論或偶像崇拜思想,對社群氛圍造成負面影響。

    My Notes Extension 的開發宗旨在於提供一個更理性且具建設性的方式來管理和標記這些帳號。透過為特定帳號添加備註,使用者可以:

    1. 保持資訊多樣性:避免因封鎖而失去接觸不同觀點和訊息的機會,促進更全面的資訊攝取。
    2. 提高警覺性:對於疑似假帳號或有害內容的帳號進行標記,提醒自己在互動時保持警覺,避免被誤導或受害。
    3. 個人化管理:根據自身需求和偏好,自主決定哪些帳號需要特別關注或避免,把小白癡抓出來。

    透過這個擴充套件,使用者能夠更有效地管理社群網路中的人際關係和資訊流,既不失去多元觀點的來源,又能保護自己免受有害內容的影響。

    以上說明在網站上也有,點這裡


    我放在 Github 上開源:

    是不連網路的外掛,但如果你想節省電腦空間或是量十分大的話,可以修改原始碼讓他連網儲存。

    以下功能特色:

    功能特色

    1. 在 FB / IG / YT / Threads 網頁中自動偵測:

    • 為用戶名稱或頻道頁面加入「備註」欄位,讓你能隨時紀錄、查看、編輯筆記。

    2. 匯出與匯入 JSON:

    • 只要在 Popup 內點擊匯出按鈕,即可將所有備註以 JSON 輸出。
    • 也可貼上 JSON 一鍵匯入,實現多瀏覽器或重裝後快速搬移。

    3. 搜尋功能

    • 支援格式化的搜尋功能,可輸入指定的平臺前綴與帳號名稱進行精準查詢(例如查詢:FB|user123)。
    • 適用於多個平臺,讓你快速定位目標帳號的備註資料。

    目前還未上架,離線操作以下參考安裝方式:

    • 尚未上架
      • 你可以手動下載整個專案,並在 chrome://extensions/ → 開啟「開發者模式」 → 點擊「載入未封裝項目」,選擇本專案資料夾。
    • Chrome Web Store

    2024-12-21 已經提交審核,希望上架順利,使用順利。

    附上為了審核截的一堆圖

    以上,期待網路上小白癡越來越少,我 2025 年要想辦法減少遊蕩在社群網站上的時間,健身房和其他娛樂要多一些,希望可以把大學和研究所的我融合起來吧~

  • Sublime Text3 檢查 Codeigniter4 專案的外掛

    Sublime Text3 檢查 Codeigniter4 專案的外掛

    使用 Sublime Text 檢查 CodeIgniter 4 專案的命名規範與 use 語句。

    在 CodeIgniter 4 開發中,為了提升專案的可維護性,遵守檔案命名規範與 use 語句的正確性是非常重要的。然而,手動檢查這些細節可能耗時且容易出錯。為了解決這個問題,我開發了一款 Sublime Text 外掛,專門用於自動檢查 CodeIgniter 4 專案的命名規範和 use 語句。

    在這篇文章中,我將介紹這個外掛的功能、使用方式、注意事項,以及如何對其進行客製化修改。


    外掛功能(截至 2024-12-13)

    這個外掛的主要功能是檢查 PHP 檔案是否符合 CodeIgniter 4 的命名規範和 use 語句的使用規則:

    1. 檔案命名規範檢查
      • 確保所有 PHP 檔案名稱遵循 PascalCase 並以 .php 結尾。
      • 舉例:MyClass.php 是正確的命名,my_class.php 則會觸發警告。
    2. use 語句檢查
      • 檢查是否所有使用到的類別名稱都已經通過 use 正確引入。
      • 找出未被使用的類別,協助開發者清理多餘的 use 語句。
    3. CodeIgniter 4 專案結構檢查
      • 自動檢測專案是否為 CodeIgniter 4,要求至少包含以下目錄:
        • 必須有:app/writable/
        • 至少存在:public/vendor/

    如何安裝與使用

    1. 下載外掛
    2. 安裝外掛
      • 將外掛放入 Sublime Text 的 Packages 目錄中: Sublime Text > Preferences > Browse Packages 將外掛資料夾解壓縮到上述目錄內。
    3. 保存 PHP 檔案以觸發檢查
      • 在 Sublime Text 中打開 CodeIgniter 4 專案的 PHP 檔案,進行編輯後保存。
      • 外掛會自動檢查檔案並在 Sublime Text 狀態列中顯示結果。
      • 如果發現錯誤,會彈出對話框提醒,顯示具體問題。

    使用注意事項(截至 2024-12-13)

    1. 適用專案
      • 此外掛僅適用於 CodeIgniter 4 專案,需保證專案根目錄存在 .env 檔案,並符合 CodeIgniter 4 的基本目錄結構。
    2. 支援的檔案類型
      • 僅檢查 .php 檔案,其他檔案類型將被忽略。
    3. 檢查邏輯
      • 外掛會移除 PHP 中的註解與引號內容來確保檢查不受干擾,但可能會忽略某些極端情況。例如,代碼中以字串拼接的動態類別名稱。

    如何進行修改

    如果你需要針對專案需求進一步客製化這個外掛,可以參考以下指引:

    1. 修改專案結構檢查邏輯

    • is_codeigniter4_project 方法中,你可以自訂需要檢查的目錄結構: def is_codeigniter4_project(self, directory): required_paths = ["app", "writable"] optional_paths = ["public", "vendor"] for path in required_paths: if not os.path.isdir(os.path.join(directory, path)): return False if not any(os.path.isdir(os.path.join(directory, path)) for path in optional_paths): return False return True

    2. 新增自訂檢查規則

    • 如果需要檢查額外的命名規範或程式碼規範,可以在 check_file_namingcheck_use_statements 方法中新增對應邏輯。

    3. 排除特定情境

    • 若某些專案使用特定的非標準命名方式,可以修改正則表達式來放寬檢查。例如: if not re.match(r"^[A-Z][a-zA-Z0-9_]*\.php$", base_name):

    4. 偵錯模式

    • 在開發或調試外掛時,可以透過 print 將日誌輸出到 Sublime Text 的 Console(`Ctrl+“)。

    結語

    這個 Sublime Text 外掛旨在提升 CodeIgniter 4 專案的開發效率,減少手動檢查的時間成本。如果你有其他需求或遇到問題,歡迎前往 GitHub 儲存庫 提交 Issue 或 Pull Request。

    希望這款工具能夠成為你在 CodeIgniter 4 開發中的得力助手!

    笑死,現在部落格用 AI 幫忙生成,講的比自己清楚。附上連結:

  • Debian 11 中更改系統語言,解決亂碼問題

    Debian 11 中更改系統語言,解決亂碼問題

    我最近有點想試試看用 AI 寫部落格,絕對不是因為我懶。

    如果你在使用 Debian 11 時,發現終端機中跳出一堆莫名其妙的菱形方塊亂碼,那不用擔心,這是語系設定的問題!我需要把語系改回英文。

    以下步驟說明:


    Step 1:修改語言設定檔
    首先,我們需要調整系統的語言設定。打開終端機,輸入以下指令來編輯設定檔案:

    sudo nano /etc/default/locale

    進入檔案後,會看到類似這樣的內容:

    LANG="zh_CN.UTF-8"
    LANGUAGE="zh_CN:zh"

    把它改成下面的樣子:

    LANG="en_US.UTF-8"
    LANGUAGE="zh_CN:zh:en_US:en"

    這樣的設定表示系統的主要語言改為英文。


    Step 2:重啟系統
    完成上面步驟後,重新啟動系統,讓設定生效:

    sudo reboot

    以上,修改了一些資訊表達不是我想要的內容,AI 文字有夠假掰。

  • 解決 PHP8.2  mb_convert_encoding 方法已經棄用的問題。

    解決 PHP8.2 mb_convert_encoding 方法已經棄用的問題。

    PHP 中 mb_convert_encoding() 實作了將字串從一種字元編碼轉換為另一種字元編碼,但是在 PHP 8.2 時這個方法就棄用了,找到解決辦法並且測試一下。

    先講結論,應該使用這個方法

    function _($string)
    {
        return mb_encode_numericentity(
            htmlspecialchars_decode(
                htmlentities($string, ENT_NOQUOTES, 'UTF-8', false)
                , ENT_NOQUOTES
            ), [0x80, 0x10FFFF, 0, ~0],
            'UTF-8'
        );
    }

    參考這裡是正確答案:

    測試程式碼:

    <?php
    
    $string = '中文:!"$%&/()=ÖÄÜöäü<<accentué За матеріалами';
    
    
    echo mb_convert_encoding($string, 'HTML-ENTITIES', 'utf-8')."\n\n";
    // 方法 1
    echo mb_encode_numericentity(
        htmlspecialchars_decode(
            htmlentities($string, ENT_NOQUOTES, 'UTF-8', false)
            ,ENT_NOQUOTES
        ), [0x80, 0x10FFFF, 0, ~0],
        'UTF-8'
    );
    echo "\n\n";
    // 方法 2
    echo htmlspecialchars_decode(htmlentities($string));

    變化後方法 1 和原方法是一樣的。先自首,我其實看不太懂這意思,丟個 AI 解釋水字數一下:

    這段程式碼通過以下步驟將 UTF-8 字符串轉換為 HTML 實體:

    1. htmlentities():將特殊字符轉換為 HTML 實體,但不處理引號。
    2. htmlspecialchars_decode():將 HTML 實體轉回原始字符。
    3. mb_encode_numericentity():將範圍內的字符轉換為數值實體表示,這裡的範圍 [0x80, 0x10FFFF] 適用於大多數 Unicode 字符。

    此方法提供更精確的 HTML 實體處理,尤其適合多字節字符編碼。

    接下來就是接 DOMDocument 做 HTML 解析了,DOMDocument 還會有一個問題是 HTML5 不太支援,這算是用 PHP 做爬蟲的原罪吧。

  • 如何在網站中整合 Google reCAPTCHA v3

    如何在網站中整合 Google reCAPTCHA v3

    關於 Google reCAPTCHA v3 ,才想起來之前用的幾乎都是 v2 ,應該更新一下自己的技能樹,真的腿。

    幾個注意事項:

    1. 幾個注意的要點:
      • 引用 js 檔案,注意前端使用 site key
      • 後端的 Secret Key 作驗證,注意不要外流
    2. 下面提供操作流程,除了使用 js 驗證的方法之外,官網也由提供 onSubmit 的方法,參考這裡
    3. 後端確認的說明參考官網,這裡。注意分數的判斷。
    4. 如果不想用分數來做判斷,可以選用 v2 ,他也有不同的操作模式,參考這裡這裡
    5. 有其使用限制,不同版本參考這裡,免費上限是 10k / 月,注意是一個帳戶。
    6. 有一些操作細節,像是 action 的設置可以作為不同驗證分數的評估手段等等。

    另外除了 Google reCAPTCHA v3 也有其他替代品,Cloudflare 也提供 Turnstile ,計費方式不太一樣。除了上述兩個,還有 hCaptcha ,甚至他還提供了 reCAPTCHA 轉換 hCAPTCHA 的說明,價格參考這裡(好像免費只能試用?)。

    Google reCAPTCHA v3 驗證邏輯上大概就是 Google 透過魔法(笑)在前端透過瀏覽器判斷這個用戶是不是機器人,產出一個驗證的落落長咒語,然後傳給後端確認,後端透過回傳給 google 來判斷 score,自行判斷是不是機器人,我理解大致上 0.5 以上就是人類。

    關於操作的流程,其實官網文章其實已經說了很明白了。既然要水字數的話,來人阿!上 AI:

    如何在網站中整合 Google reCAPTCHA v3

    Google reCAPTCHA v3 是一個無干擾的防護機制,它不需要使用者解決驗證挑戰,透過評分系統自動識別惡意行為。以下將介紹如何在網站中實作 reCAPTCHA v3 的步驟。

    步驟 1: 註冊 Google reCAPTCHA v3

    1. 進入 Google reCAPTCHA 管理台
    2. 登入你的 Google 帳戶,並填寫下列資訊:
      • 標籤:為這個 reCAPTCHA v3 設定提供一個識別名稱。
      • reCAPTCHA 類型:選擇 “reCAPTCHA v3″。
      • 網域:輸入你網站的網域名稱。
      • 所有者:設定擁有這個 reCAPTCHA 的電子郵件。
    3. 同意 reCAPTCHA 服務條款,並點擊 “提交”。

    完成註冊後,你將獲得 站點金鑰 (Site Key)祕密金鑰 (Secret Key)

    步驟 2: 將 reCAPTCHA v3 加入你的網站

    在你的 HTML 頁面中,加入下列 JavaScript 程式碼以載入 reCAPTCHA v3:

    <script src="https://www.google.com/recaptcha/api.js?render=你的站點金鑰"></script>

    在你想要執行驗證的操作中(例如表單提交),調用 grecaptcha.execute()

    <script>
      grecaptcha.ready(function() {
        grecaptcha.execute('你的站點金鑰', {action: 'submit'}).then(function(token) {
          // 將 token 傳送至你的伺服器進行驗證
        });
      });
    </script>

    步驟 3: 在後端進行驗證

    當使用者提交表單時,你需要在伺服器端驗證 reCAPTCHA token。以下範例為使用 PHP 進行驗證:

    <?php
      $token = $_POST['token'];
      $secret_key = '你的祕密金鑰';
    
      $response = file_get_contents("https://www.google.com/recaptcha/api/siteverify?secret={$secret_key}&response={$token}");
      $responseKeys = json_decode($response, true);
    
      if ($responseKeys["success"] && $responseKeys["score"] >= 0.5) {
        // 驗證通過,繼續處理表單
      } else {
        // 驗證失敗,阻止表單提交
      }
    ?>

    步驟 4: 調整評分閾值

    Google reCAPTCHA v3 使用 0 到 1 的評分來衡量使用者行為,1 表示良好使用者,0 表示惡意行為。你可以根據需求來調整評分閾值,例如將其設為 0.5 以上代表驗證通過。

    以上,再來補一個 Cloudflare Turnstile 操作流程。

    Cloudflare Turnstile 操作流程

    1. 註冊並取得 Turnstile 金鑰

    • 首先,登入你的 Cloudflare 帳戶,進入 Turnstile 管理頁面。
    • 點選「新增站點」,輸入你的網站名稱和網域,選擇所需的小工具模式(例如隱形或管理模式)。
    • 完成後,系統會生成一組 sitekeysecret key,請妥善保存這些金鑰,因為它們將用於驗證操作。

    2. 在網站前端加入 Turnstile

    在你的 HTML 頁面 <head> 區塊中插入以下 JavaScript 程式碼,用以載入 Turnstile 小工具:

    <script src="https://challenges.cloudflare.com/turnstile/v0/api.js" async defer></script>

    接著,在需要驗證的位置,加入以下 HTML 元素,例如表單內:

    <form id="login-form" action="/login" method="POST">
        <input type="text" name="username" placeholder="用戶名" required>
        <input type="password" name="password" placeholder="密碼" required>
        <div class="cf-turnstile" data-sitekey="YOUR-SITE-KEY"></div>
        <button type="submit">登入</button>
    </form>

    這段代碼會在頁面上自動載入 Turnstile 小工具,用於保護表單提交。

    3. 後端驗證 Turnstile Token

    當使用者提交表單後,Turnstile 會返回一個 token,必須在伺服器端進行驗證。

    以下是後端驗證 token 的範例:

    <?php
      // 從表單中接收 Turnstile 的 response token
      $turnstileToken = $_POST['cf-turnstile-response'];
      
      // 你的 secret key,請妥善保管
      $secretKey = 'your-secret-key';
    
      // 設置驗證請求的參數
      $data = [
        'secret' => $secretKey,
        'response' => $turnstileToken,
        'remoteip' => $_SERVER['REMOTE_ADDR'] // 可選的,用來記錄用戶 IP
      ];
    
      // 初始化 cURL
      $ch = curl_init();
    
      // 配置 cURL 請求
      curl_setopt($ch, CURLOPT_URL, "https://challenges.cloudflare.com/turnstile/v0/siteverify");
      curl_setopt($ch, CURLOPT_POST, true);
      curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($data));
      curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    
      // 執行 cURL 請求並獲取回應
      $response = curl_exec($ch);
      curl_close($ch);
    
      // 將 JSON 格式的回應轉換為 PHP 陣列
      $responseData = json_decode($response, true);
    
      // 檢查驗證結果
      if ($responseData['success']) {
        // 驗證成功,執行你的邏輯
        echo '驗證成功,繼續進行處理';
      } else {
        // 驗證失敗
        echo '驗證失敗,請重試';
      }
    ?>

    你也可以用 Cloudflare Worker 處理:

    // This is the demo secret key. In production, we recommend
    // you store your secret key(s) safely.
    const SECRET_KEY = "1x0000000000000000000000000000000AA";
    
    async function handlePost(request) {
      const body = await request.formData();
      // Turnstile injects a token in "cf-turnstile-response".
      const token = body.get("cf-turnstile-response");
      const ip = request.headers.get("CF-Connecting-IP");
    
      // Validate the token by calling the
      // "/siteverify" API endpoint.
      let formData = new FormData();
      formData.append("secret", SECRET_KEY);
      formData.append("response", token);
      formData.append("remoteip", ip);
    
      const url = "https://challenges.cloudflare.com/turnstile/v0/siteverify";
      const result = await fetch(url, {
        body: formData,
        method: "POST",
      });
    
      const outcome = await result.json();
      if (outcome.success) {
        // ...
      }
    }

    此步驟確保 token 是有效的,且未被重複使用,防止重放攻擊。

    4. 從 Google reCAPTCHA 遷移

    如果你目前使用的是 Google reCAPTCHA,可以使用 Turnstile 的兼容模式,修改載入腳本:

    <script src="https://challenges.cloudflare.com/turnstile/v0/api.js?compat=recaptcha" async defer></script>

    將現有代碼中的 grecaptcha.render() 呼叫,改為使用你的 Turnstile sitekey,這樣可以無縫切換。

    透過這些步驟,你可以在網站中輕鬆整合 Cloudflare Turnstile,提升網站安全性並替代傳統的驗證碼工具。

    同場加映:

    hCaptcha 運作的循序圖,這類操作大多都類似。

    Cloudflare 提供 Turnstile 的計費方式(此為 2024-10-22 時截圖)。這種服務大多就是搶市佔率,然後套養殺的商業模型。到時看看有沒有越來越貴就知道他用的人多不多了。

  • 使用 Nginx 基本認證保護動態內容。以一個舊網站為例。

    使用 Nginx 基本認證保護動態內容。以一個舊網站為例。

    最近處理一個舊網站,因為是 demo 用途所以帳號密碼基本上都隨便設定。但是我不想給陌生人掃進來 try error ,所以想到在 Nginx 上上添加 auth_basic 的功能。

    環境如下:

    1. 這個舊網站非常舊,是 ThinkPHP 的 5.x.x 版本
    2. 裡面會 php 設定網址後綴 .html 所以網址會變成 https://xxx.xxx/PATH/ooooo.html 這樣

    先上注意事項:

    1. 我最後選擇保護 .php 檔案,如果有其他需要保護的,甚至靜態檔案請確保 location 的設定。
    2. 因為是 location 選擇 php 檔案,所以驗證通過以後要走一樣的操作順序。
      • 得自首一下,這部分我 try error 很久,是試出來的結論。書到用時方恨少,以後有機會記得補上有系統的原理原則。
    3. 建議使用 HTTPS 避免 header 的帳密被中間人攻擊。
    4. auth_basic 幾個基本知識網路上滿多的,參考這裡這裡這裡

    補上程式碼:

    /PATH_AUTH_BASIC/auth_basic.conf

    # Directory protection rules
    location ~* \.php$ {
        auth_basic "Authorization";
        auth_basic_user_file /PATH/Need_Password.pass;
        # 如果驗證通過則走 PHP 動作
        include PHP-73.conf;
        # 如果是靜態的 .html 文件,則直接嘗試提供
        rewrite  ^(.*)$  /index.php?s=$1  last;   break;
    }
    

    而操作順序, 在 server 的 block 裡面如下:

    ...
    #Directory protection rules
    include /PATH_AUTH_BASIC/auth_basic.conf;
        
    #PHP reference configuration
    include PHP-73.conf;
    
    #REWRITE-START URL rewrite rule reference, any modification will invalidate the rewrite rules set by the panel
    include /PATH_REWRITE/rewrite.conf;
    ...

    補上 ThinkPHP 的 rewrite.conf 主要的設定:

    ...
    location / {
    	if (!-e $request_filename){
    		rewrite  ^(.*)$  /index.php?s=$1  last;   break;
    	}
    	try_files $uri $uri/ =404;
    }
    ...