数十ページのPDFを1回で処理、ローカルOCRモデル「Unlimited OCR」をバイドゥが無料公開。商用利用もできる（生成AIクローズアップ） | テクノエッジ TechnoEdge

テクノエッジ TechnoEdge

https://www.techno-edge.net/article/2026/06/29/5234.html

今回の生成AIクローズアップは、Baiduの研究チームが開発した、数十ページのPDFなど長文を一括処理できるエンドツーエンドのOCRモデル「Unlimited OCR」を取り上げます。

🔒 99

💬 34

無言を隠す

先着人気新着 ➡️

SeamlessDeepSeek OCR 2を超える精度で、数十ページのドキュメントを1回の計算でテキスト化できる。人間の書き写しを模倣した仕組みを採用。MITライセンス

2026/06/29 08:41

auto_chanいつでもさがしているよ～　PDF+OCRの決定版を～

2026/06/29 11:47★★★★★★★★★★

sstr649286onnxOCRと同じ使い勝手で精度が良いならいいな

2026/06/29 12:15

fashiテキスト化した後どうなるんです？(レイアウトを再現するには？透明テキストPDF?)

2026/06/29 12:39★

yorkfield"レイアウトを再現するには？" ／ coordinate boxの情報も得られるようなので、利用者側で好きに再現すれば良い。

2026/06/29 12:54

tohokuaiki次は導入方法の記事がまたれる

2026/06/29 13:51★

hirakawahanzoおお

2026/06/29 14:04

ntdtksビジネスで手書き絶滅している現代、PDFの作成元はテキスト文字だろうに、どうして抽出に手間がかかるのか。ウチの会社はファイルアップもローカルアプリも許可制だから、この無料ＯＣＲも使えないかぁ

2026/06/29 14:40★★★

dame_maru「百度が無料公開」って文言に勘繰ってしまうくらい私は汚れた人間です

2026/06/29 15:28★★★★★★★★★

suka6411144中華系のAI企業がOCRモデル結構出してるけど向こうでもOCR需要が高いんだろうか

2026/06/29 15:35

jabberokkieバイドゥが無料公開？何のために？？

2026/06/29 15:37★

fwb603でも漏れるんでしょ？

2026/06/29 15:48

lbtmplz俺の汚い手書き文字を間違わなくなったら起こして

2026/06/29 16:09

kaeruyan中国語（漢字）のOCRは大変そうやから日本語は楽なのか？ローカルなのは良いね。

2026/06/29 16:20

masalib「バイドゥが無料公開」・・・使うことはできないな～無理

2026/06/29 16:22★★

iwwなるほどうまいこと考えたもんだな。無料ってのもまたいい。使用禁止サービスに追加しとこう

2026/06/29 16:29★★

ys0000日本語性能が高いのか(特に勝手に中国語として認識されないか、言語指定できるのか)が気になる／https://www.google.com/amp/s/www.zaikei.co.jp/amp/article/20260626/858719.html を見る限り、日本語も大丈夫そうだし高機能ぽいね。

2026/06/29 16:31

cinefukBaiduに対するマイナスの信頼感だけが書き込まれる。古いネット民ならば当然のアクションではある

2026/06/29 16:35★★★

kamiokandoリスクの香りしかしない。

2026/06/29 16:58

FreeCatWorkボクのしっぽもPDFで読み取れるかにゃ？これがあればお昼寝の時間が増えるにゃ！

2026/06/29 17:20