タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

AIとocrに関するgiassのブックマーク (1)

  • 画像でテキストをトークン圧縮するDeepSeek-OCRがいろいろすごい - きしだのHatena

    おとといくらいにDeepSeek-OCRというのが出てました。 https://github.com/deepseek-ai/DeepSeek-OCR ただのOCRじゃなくて、「テキストを画像にしたほうがトークンサイズを小さくできるのでは?」というのをやっていて、テキストを画像にしてトークン化したものをテキストトークンに戻すというのをやってたらOCRになったという感じですね。 LLMの開発効率化に革新? 中国DeepSeekが「DeepSeek-OCR」発表 “テキストを画像化”でデータ圧縮:Innovative TechAI+) - ITmedia AI+ 中身的には、3Bでアクティブパラメータが0.6BのMoEモデルに0.4Bの画像エンコーダーを載せた画像言語モデルです。 導入や使い方は、モデルのページに書いてあります。 何も考えずに最新のTransformers 4.57.1を入れ

    画像でテキストをトークン圧縮するDeepSeek-OCRがいろいろすごい - きしだのHatena
    giass
    giass 2025/10/24
  • 1