huihys 发表于 2025-8-25 10:30:04

基于AI的公式OCR识别、分析和管理软件

<h2>基于AI的公式<strong>识别</strong>、<strong>分析</strong>与<strong>管理</strong>软件</h2>
<p><em><strong>https://github.com/Ryson-32/AI-Formula-Scanner</strong></em></p>
<p><strong>一款AI公式识别、分析与管理工具。一键转为可编辑的 LaTeX,并分析变量含义与核查潜在错误。</strong><br />
<strong>解决痛点</strong>:解决“公式图片难以快速准确转 LaTeX”“识别后缺少校验与整理”“公式中不认识的变量需要繁琐查询”的问题。<br />
<strong>主要技术</strong>:Tauri + Rust(截图、系统集成)/ SvelteKit + TypeScript(前端)。<br />
<strong>核心功能</strong>:三阶段公式识别:LaTeX 提取 → 智能分析(标题/摘要/变量/术语/建议)→ 核查与置信度。<br />
<strong>适用场景</strong>:科研写作与论文公式录入、教材与讲义排版、课堂/会议拍照后快速转录、学习笔记整理、技术博客与知识库维护。</p>
<h3>一次识别调用三次LLM:</h3>
<ul>
<li>第1次(LaTeX 提取):仅从图片提取 <strong>LaTeX</strong> 文本。</li>
<li>第2次(智能分析):与第一次并发。基于图片生成<strong>标题、简介、变量表、术语表与建议</strong>。</li>
<li>第3次(核查与置信度):在第一次调用返回LaTeX后开始。对比“提取到的 LaTeX + 原图”,产出<strong>状态(ok/warning/error)、问题列表</strong>、覆盖率与 0–100 的置信度。</li>
</ul>
<h3>建议的模型选择与耗时:</h3>
<ul>
<li>Gemini-2.5-flash:综合准确率与速度较优。常见公式约 10s 左右,复杂场景约 20s。</li>
<li>Gemini-2.5-flash-lite:用于轻量场景,在复杂公式上准确性略差。</li>
<li>Gemini-2.5-pro:准确率接近<strong>100%</strong>,但复杂公式速度很慢。</li>
</ul>
<p><strong>支持区域截图(默认快捷键 `Ctrl + Shift + A`)或导入本地图片</strong><br />
<img src="https://images.bigseek.com//forum/202508/25/103213mmpupho1u17mto2w.png" alt="fc7fc81bc68f57450782fee1a2b2b04e15de16d0.png" title="fc7fc81bc68f57450782fee1a2b2b04e15de16d0.png" /></p>
<p><strong>智能分析生成变量表、术语表与建议</strong><br />
<img src="https://images.bigseek.com//forum/202508/25/103231k306edgyrgusuerr.png" alt="bd9842f43c9eef67c0371e4194008a53b8000614.png" title="bd9842f43c9eef67c0371e4194008a53b8000614.png" /><br />
<img src="https://images.bigseek.com//forum/202508/25/103243d57cm15ivm52aehm.png" alt="a4ff52f603c6080e7f589c15386e6266bbaf7893.png" title="a4ff52f603c6080e7f589c15386e6266bbaf7893.png" /><br />
<img src="https://images.bigseek.com//forum/202508/25/103250es81m99de8gc99is.png" alt="2a27f744f7613593b834cf994e296c0a2f417010.png" title="2a27f744f7613593b834cf994e296c0a2f417010.png" /></p>
<p><strong>识别公式管理</strong><br />
<img src="https://images.bigseek.com//forum/202508/25/103328be7ni4gt4etk3ei4.webp" alt="314d9c16ec02fdd33a31e622b43c421d362914e2.webp" title="314d9c16ec02fdd33a31e622b43c421d362914e2.webp" /><img src="https://www.bigseek.com/data/attachment/forum/202508/25/103334vlleullxuku6xzlk.webp" alt="0b3f6f5cea659968e36b6841f3f435a11d8ec183.webp" title="0b3f6f5cea659968e36b6841f3f435a11d8ec183.webp" /></p>
<p><strong>API调用可使用轮询工具</strong></p>
<p><img src="https://images.bigseek.com//forum/202508/25/103444wh3zv899v9r8t9tg.png" alt="ee09bcd142af1bd66b7cda01dd9184b99ddc1722.png" title="ee09bcd142af1bd66b7cda01dd9184b99ddc1722.png" /></p>
<p><strong>可自定义三次调用的提示词</strong></p>
<p><img src="https://images.bigseek.com//forum/202508/25/103500vbd9k9kqkfcf7ck9.webp" alt="3ce88c76507042126abfb66cc278ce9d58140bd6.webp" title="3ce88c76507042126abfb66cc278ce9d58140bd6.webp" /></p>

粉望 发表于 2025-8-25 11:45:41

好嘞,有空的时候回头改一下。

dxking 发表于 2025-8-25 12:29:34

太强了,老哥。

lukeluk 发表于 2025-8-25 13:27:15

感谢大佬哦

IT货郎 发表于 2025-8-25 15:49:40

感谢大佬

Dustinmindy 发表于 2025-8-25 20:27:33

感谢分享

tjohn 发表于 2025-8-26 12:06:43

感谢大佬

fans2006 发表于 2025-8-26 17:14:50

跟mathpix好像!

黄雨子 发表于 2025-8-28 14:18:16

Win11好像存在依赖问题,
我上传了一个便携版,
可以再试试便携版哈

念奴娇 发表于 6 天前

感谢分享,加个部署说明会不会好一些

cooker 发表于 6 天前

基于人工智能的公式识别、分析与管理软件
页: [1]
查看完整版本: 基于AI的公式OCR识别、分析和管理软件