
数十ページのPDFを1回で処理、ローカルOCRモデル「Unlimited OCR」をバイドゥが無料公開。商用利用もできる(生成AIクローズアップ) | テクノエッジ TechnoEdge
今回の生成AIクローズアップは、Baiduの研究チームが開発した、数十ページのPDFなど長文を一括処理できるエンドツーエンドのOCRモデル「Unlimited OCR」を取り上げます。

SeamlessDeepSeek OCR 2を超える精度で、数十ページのドキュメントを1回の計算でテキスト化できる。人間の書き写しを模倣した仕組みを採用。MITライセンス
2026/06/29 08:41

auto_chanいつでもさがしているよ~ PDF+OCRの決定版を~
2026/06/29 11:47★★★★★★★★★★

sstr649286onnxOCRと同じ使い勝手で精度が良いならいいな
2026/06/29 12:15

fashiテキスト化した後どうなるんです?(レイアウトを再現するには?透明テキストPDF?)
2026/06/29 12:39★

yorkfield"レイアウトを再現するには?" / coordinate boxの情報も得られるようなので、利用者側で好きに再現すれば良い。
2026/06/29 12:54

tohokuaiki次は導入方法の記事がまたれる
2026/06/29 13:51★

hirakawahanzoおお
2026/06/29 14:04

ntdtksビジネスで手書き絶滅している現代、PDFの作成元はテキスト文字だろうに、どうして抽出に手間がかかるのか。ウチの会社はファイルアップもローカルアプリも許可制だから、この無料OCRも使えないかぁ
2026/06/29 14:40★★★

dame_maru「百度が無料公開」 って文言に勘繰ってしまうくらい私は汚れた人間です
2026/06/29 15:28★★★★★★★★★

suka6411144中華系のAI企業がOCRモデル結構出してるけど向こうでもOCR需要が高いんだろうか
2026/06/29 15:35

jabberokkieバイドゥが無料公開?何のために??
2026/06/29 15:37★

fwb603でも漏れるんでしょ?
2026/06/29 15:48

lbtmplz俺の汚い手書き文字を間違わなくなったら起こして
2026/06/29 16:09

kaeruyan中国語(漢字)のOCRは大変そうやから日本語は楽なのか?ローカルなのは良いね。
2026/06/29 16:20

masalib「バイドゥが無料公開」・・・使うことはできないな~無理
2026/06/29 16:22★★

iwwなるほどうまいこと考えたもんだな。無料ってのもまたいい。 使用禁止サービスに追加しとこう
2026/06/29 16:29★★

ys0000日本語性能が高いのか(特に勝手に中国語として認識されないか、言語指定できるのか)が気になる/https://www.google.com/amp/s/www.zaikei.co.jp/amp/article/20260626/858719.html を見る限り、日本語も大丈夫そうだし高機能ぽいね。
2026/06/29 16:31

cinefukBaiduに対するマイナスの信頼感だけが書き込まれる。古いネット民ならば当然のアクションではある
2026/06/29 16:35★★★

kamiokandoリスクの香りしかしない。
2026/06/29 16:58

FreeCatWorkボクのしっぽもPDFで読み取れるかにゃ?これがあればお昼寝の時間が増えるにゃ!
2026/06/29 17:20