数十ページのPDFを1回で処理、ローカルOCRモデル「Unlimited OCR」をバイドゥが無料公開。商用利用もできる(生成AIクローズアップ) | テクノエッジ TechnoEdge

今回の生成AIクローズアップは、Baiduの研究チームが開発した、数十ページのPDFなど長文を一括処理できるエンドツーエンドのOCRモデル「Unlimited OCR」を取り上げます。
🔒 99
💬 34
SeamlessDeepSeek OCR 2を超える精度で、数十ページのドキュメントを1回の計算でテキスト化できる。人間の書き写しを模倣した仕組みを採用。MITライセンス
2026/06/29 08:41
auto_chanいつでもさがしているよ~ PDF+OCRの決定版を~
2026/06/29 11:47★★★★★★★★★
sstr649286onnxOCRと同じ使い勝手で精度が良いならいいな
2026/06/29 12:15
fashiテキスト化した後どうなるんです?(レイアウトを再現するには?透明テキストPDF?)
2026/06/29 12:39
yorkfield"レイアウトを再現するには?" / coordinate boxの情報も得られるようなので、利用者側で好きに再現すれば良い。
2026/06/29 12:54
tohokuaiki次は導入方法の記事がまたれる
2026/06/29 13:51
hirakawahanzoおお
2026/06/29 14:04
ntdtksビジネスで手書き絶滅している現代、PDFの作成元はテキスト文字だろうに、どうして抽出に手間がかかるのか。ウチの会社はファイルアップもローカルアプリも許可制だから、この無料OCRも使えないかぁ
2026/06/29 14:40★★★
dame_maru「百度が無料公開」 って文言に勘繰ってしまうくらい私は汚れた人間です
2026/06/29 15:28★★★★★★★★★
suka6411144中華系のAI企業がOCRモデル結構出してるけど向こうでもOCR需要が高いんだろうか
2026/06/29 15:35
jabberokkieバイドゥが無料公開?何のために??
2026/06/29 15:37
fwb603でも漏れるんでしょ?
2026/06/29 15:48
lbtmplz俺の汚い手書き文字を間違わなくなったら起こして
2026/06/29 16:09
kaeruyan中国語(漢字)のOCRは大変そうやから日本語は楽なのか?ローカルなのは良いね。
2026/06/29 16:20
masalib「バイドゥが無料公開」・・・使うことはできないな~無理
2026/06/29 16:22★★
iwwなるほどうまいこと考えたもんだな。無料ってのもまたいい。 使用禁止サービスに追加しとこう
2026/06/29 16:29
ys0000日本語性能が高いのか(特に勝手に中国語として認識されないか、言語指定できるのか)が気になる/https://www.google.com/amp/s/www.zaikei.co.jp/amp/article/20260626/858719.html を見る限り、日本語も大丈夫そうだし高機能ぽいね。
2026/06/29 16:31
cinefukBaiduに対するマイナスの信頼感だけが書き込まれる。古いネット民ならば当然のアクションではある
2026/06/29 16:35★★★
kamiokandoリスクの香りしかしない。
2026/06/29 16:58
FreeCatWorkボクのしっぽもPDFで読み取れるかにゃ?これがあればお昼寝の時間が増えるにゃ!
2026/06/29 17:20