Verification code identification based on OCR (Tesseract) and CV (OpenCV)
npm install captcha-cv-ocr
使用 CV (OpenCV) 和 OCR (Tesseract) 进行验证码识别
bash
npm i opencv4nodejs -g
`
第三种验证码识别改为用 sharp 和纯 JavaScript 的 CV 算法来实现,方便在树莓派上运行,但效率相比前两者很低。
第二个 Tesseract 支持模块为 tesseract.js
直接安装
`bash
npm i captcha-cv-ocr
`
或者
`bash
git clone https://github.com/PillarsZhang/captcha-cv-ocr
cd captcha-cv-ocr
npm install
npm link #约等于安装为全局模块
`
$3
`bash
node judge_and_test.js
`
$3
`javascript
const path = require("path");
const cvocrModule = require("captcha-cv-ocr");
var mode = "simplest";
(async () => {
let cvocr = new cvocrModule(mode); // mode 表示验证码的种类
await cvocr.init(1); //其中的1表示需要启动的 OCR Worker 数(多线程)
let ans = await cvocr.recognize(path.join(__dirname, "docs/img", mode + ".jpg")); //支持文件地址、Base64、Buffer形式
console.log("ans:", ans)
process.exit(0);
})()
``