[B! LLM][GPT] testedqualityのブックマーク

RAGの実装戦略まとめ - Qiita

それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチこちらは、性質の異なる複数の検索方式（例えばベクトル検索とキーワード検索）を組み合わせて検索精度を向上させる手法になります。各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質

testedquality 2024/09/12

リンク

LLMのプロンプト技術まとめ - Qiita

現在，34個掲載(一部執筆途中) Xのアカウント@fuyu_quantでも技術系の投稿をしているのでよかったらフォローしてください！はじめに今回はすぐに使えそうなプロンプトの工夫やフレームワークについて有名なものをまとめました．LMの出力の精度向上に役立てられればと思います．論文があるものについてはarXivに最初に投稿された順番で掲載しています．論文で精度向上が確認されているのは英語での検証がほとんどであるため，日本語で改善されるかは分かりません．全てのLLM(GPT-4,Llama2,...)で精度が改善するとは限りません． ※記事に誤り等ありましたらご指摘いただけますと幸いです．以下の記事では敵対的プロンプト技術をまとめています！目次 Zero-shot prompting Few-shot prompting 2021年〜 Generated Knowledge Pr

testedquality 2023/10/26

リンク

OpenAIのEvalsを利用してLLMの性能をテストする方法｜mah_lab / 西見公宏

OpenAIのGPT-4 APIのウェイティングリストに申し込むと、メールで以下のような内容が送られてきます。 While we ramp up, invites will be prioritized to developers who have previously build with the OpenAI API. You can also gain priority access if you contribute model evaluations to OpenAI Evals that get merged, as this will help us improve the models for everyone. OpenAI APIで開発したことがある開発者に優先的に招待します。また、OpenAI Evalsにモデル評価を投稿し、それがマージされた場合にも、優先的にアク

testedquality 2023/05/06

GPT-4のAPI使いたいのでテストしてみる

リンク

完全に知識ゼロから ChatGPT MeetUp Tokyo #0 をおっかけ視聴してみた - 電磁波に撃たれて眠りたい！

去る2023年4月28日(金)に虎ノ門の KDDI Digital Gateで開催された「ChatGPT Meetup Tokyo #0」もともと会場側スタッフとして参加する予定だったんですが、先約があり参加できなかったため、Youtubeのアーカイブを通じて追っかけ視聴してみました。 chatgpt.connpass.com www.youtube.com オンライン/オフラインともに、参加された人たちが口を揃えて「ヤバすぎる」「我々はどのくらい周回遅れしているのか」「エンジニアとして危機感を感じた」と語られていたので身構えながら挑みましたが、それは本当でした。自分がどれだけこの分野についての知見が浅かったのか、上辺だけの情報しか見てなかったのか思い知らされることになりました。このブログ記事は、タイトルにあるとおりLLMに関して本当に何も知らない私が私なりに残したメモと所感

testedquality 2023/05/05

まだ確認できていない資料を見つけたのでまとめありがたい

リンク

百花繚乱の大規模言語モデル　その現状まとめ【2023年4月末版】

昨年末から急激に話題を呼んだChatGPT、その内部的なバージョンアップであるGPT-3.5とGPT-4はいずれもMicrosoftから強力な支援を受けた米OpenAIという企業が独占的に提供する大規模言語モデル（LLM）だ。それに呼応するかのように、Meta社からはLLaMA（ラマ）がリリースされ、LLaMAをChatGPTとの1万3千回の会話データで微調整したAlpaca（アルパカ）、AlpacaをShareGPT（GPTとの会話を有志がオープンにしたもの）のデータで微調整したVicuna（ビクーニャ）といった派生モデルが次々と登場した。しかし、LLaMAはMeta社の意向により「アカデミック用途限定」という縛りがある。またGPTの出力にはOpenAIの利用規定で「GPTの出力結果を元にGPTに対抗できる強力なAIを作ってはいけない」という制約があるため、AlpacaもVicuna

testedquality 2023/04/26

リンク

はてなブックマーク

タグ

関連タグで絞り込む (13)

LLMとGPTに関するtestedqualityのブックマーク (5)

お知らせ

今週のはてなブックマーク数ランキング（2025年5月第4週）

今週のはてなブックマーク数ランキング（2025年5月第3週）

今週のはてなブックマーク数ランキング（2025年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (13)

LLMとGPTに関するtestedqualityのブックマーク (5)

RAGの実装戦略まとめ - Qiita

LLMのプロンプト技術まとめ - Qiita

OpenAIのEvalsを利用してLLMの性能をテストする方法｜mah_lab / 西見 公宏

完全に知識ゼロから ChatGPT MeetUp Tokyo #0 をおっかけ視聴してみた - 電磁波に撃たれて眠りたい！

百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】

お知らせ

今週のはてなブックマーク数ランキング（2025年5月第4週）

今週のはてなブックマーク数ランキング（2025年5月第3週）

今週のはてなブックマーク数ランキング（2025年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

OpenAIのEvalsを利用してLLMの性能をテストする方法｜mah_lab / 西見公宏

百花繚乱の大規模言語モデル　その現状まとめ【2023年4月末版】