Few-shotとは 人気・最新記事を集めました - はてな (original) (raw)

このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

関連ブログ

nikkie-ftnextの日記5ヶ月前

基本に立ち戻る:LLMのプロンプトはじめに すべてのエンチャントを破壊する。 nikkieです 4月末に複数の勉強会でLLMのプロンプトについてインプットしました。 復習またハーケンとして、今回アウトプットします 目次 はじめに 目次 プロンプトってなんだったっけ?『大規模言語モデル入門』にあたる hoge-shotというのは、文脈内学習! 多段階の推論とchain-of-thought 例はからあげさんの登壇から(松尾研 Beginning LLM Level.1) 松尾研 LLM コミュニティ "Paper & Hacks Vol.03" 終わりに P.S. Chain-of-Thoughtを打ち切る!? プロンプトってな…

#LLM#プロンプト#GPT-3#Few-shot#in-context learning#文脈内学習#chain of thought#ステップバイステップ

ネットで話題

もっと見る

49ブックマーク例示で精度を高める「Few-shot Learning」、思考の連鎖「Chain of Thought」… 新しいパラダイム「プロンプトエンジニアリング」に対するアイデアlogmi.jp

21ブックマークGitHub - Stability-AI/lm-evaluation-harness: A framework for few-shot evaluation of autoregressive language models.github.com

19ブックマークChatGPT の基礎技術!GPT-3 と Few-shot learningChatGPT ChatGPT は OpenAI が作成したチャットボットです。何か話しかけると、次の例のように雑談相手になってくれます。 ChatGPTと雑談 ChatGPT が注目されているのは、その守備範囲の広さゆえです。問いかけの仕方次第で、翻訳・プログラミング・文書校正など広範なタスクをこなすことができます。個人的には、自分の...www.kikagaku.co.jp

15ブックマークLanguage Models are Few-Shot LearnersRecent work has demonstrated substantial gains on many NLP tasks and benchmarks by pre-training on a large corpus of text followed by fine-tuning on a specific task. While typically task-agnostic in architecture, this method still requires task-specific fine-tuning datasets of thousands or tens o...arxiv.org

13ブックマークGitHub - openai/gpt-3: GPT-3: Language Models are Few-Shot Learnersgithub.com

12ブックマークGPT-3におけるFew-Shot・Zero-Shotzenn.dev

8ブックマークFew-Shot Adversarial Learning of Realistic Neural Talking Head ModelsSeveral recent works have shown how highly realistic human head images can be obtained by training convolutional neural networks to generate them. In order to create a personalized talking head model, these works require training on a large dataset of images of a single person. However, in many p...arxiv.org

7ブックマークFew-shot Learning(フューショット学習)とは?atmarkit.itmedia.co.jp

6ブックマークChatGPTが自身の間違いに気付く、「Few-shotプロンプト」の効果xtech.nikkei.com

関連ブログ

AnyTech Engineer Blog7ヶ月前

画像内の物体の数を数える手法の論文紹介: CACViT皆さん、こんにちは。AnyTechの立浪と申します。先日、バンクーバーで開催されたAAAI-24に行ってまいりました。そこでみたポスターの中から気になった論文を一つご紹介したいと思います。[2305.04440] Vision Transformer Off-the-Shelf: A Surprising Baseline for Few-Shot Class-Agnostic Countingという論文です。この論文で対象にしているタスクは"Few-Shot Class-Agnostic Counting"です。その名の通り、数えたい物体の少量の画像を与えて、検索対象の画像の中にその物体がい…

#論文紹介#深層学習#Deep learning#数え上げ#Few-shot#画像認識#AAAI

AnyTech Engineer Blog1年前

CLIPを使った画像に対する異常検知皆さん、こんにちは。AnyTechの立浪と申します。 さて、皆さんは外観検査による異常検知には興味がおありでしょうか?最近いたるところで名前を聞く異常検知手法PatchCoreの影響か、2023年のCVPRでは異常検知手法の提案が急激に増えたように思います。PatchCoreは弊社の木村が過去の記事でも紹介していますね。今回は2023年のCVPRに採択された論文の中から、WinCLIPとWinCLIP+という異常検知手法をご紹介したいと思います。これは代表的なVision and Language ModelであるCLIPを使った異常検知手法です。CLIPらしくテキストを使っており、これまでに…

#異常検知#Deep learning#anomaly detection#深層学習#PatchCore#WinCLIP#WinCLIP+#Zero-shot#Few-shot

稗田利明のIT Insights5日前

AI-OCR「DX Suite」に新機能追加 稗田利明AI-OCR「DX Suite」に新機能追加 こんにちは、稗田利明です! AI inside株式会社が提供するAI-OCRサービス「DX Suite」に、新機能「Few-shot学習」が実装されました。この機能は、項目抽出の精度向上を目的としており、使用するほど読取精度が向上するという特徴があります。 DX Suiteは、定型・非定型を問わず様々な書類を事前学習なしで読み取れるAI-OCRサービスです。手書き文字の高精度な読み取りが可能で、データ化作業の自動化を支援します。 サービスの「項目抽出」機能は、生成AI技術を活用し、非定型帳票からも情報を抽出・デジタルデータ化できます。1000種類以…

fenfenkunの日記8日前

色々なプロンプト技術色々なプロンプト技術のまとめ。ユースケース別に精度向上のため、組み合わせて使う必要ある。 LLMプロンプト技術まとめ 技術 分類 概要 特徴 ユースケース Zero-shot prompting 基本的なプロンプト 例を示さずに質問する シンプルだが、複雑なタスクには不向き 簡単な質問応答、文章生成 Few-shot prompting 基本的なプロンプト いくつかの例を示して質問する 例から学習し、精度が向上 文章分類、翻訳、質問応答 Generated Knowledge Prompting その他精度向上 関連知識を生成しプロンプトに追加 特定の知識が必要なタスクに有効 常識推論、質問応…

yoima-study21日前

OpenAI o1は他社モデルで再現可能なのか?OpenAI o1は他社モデルで再現可能なのか? OpenAI o1は他社モデルで再現可能なのか? OpenAI o1の特徴・機能 複雑な推論能力 思考の連鎖プロセス 内部推論過程の観察可能性 OpenAI o1の思考プロセスに関する論文・研究 他社の大規模言語モデルの機能比較 OpenAIのGPTシリーズ Google Bard Anthropic Claude Meta Llama プロンプトエンジニアリングによる他社モデルの応答改善 Zero-shot prompting Few-shot prompting Chain-of-Thought (CoT) prompting OpenAI…

jiku log22日前

「大規模言語モデル入門」を読む 〜第4章 大規模言語モデルの進展〜はじめに 大規模言語モデルの入門書として,山田 育矢 著「大規模言語モデル入門」を読んでいる。本記事は第4章の読書メモである。gihyo.jp 目次 はじめに 目次 第4章 大規模言語モデルの進展 4.1 モデルの大規模化とその効果 4.2 プロンプトによる言語モデルの制御 文脈内学習 chain-of-thought 推論 4.3 アライメントの必要性 4.4 指示チューニング 4.5 人間のフィードバックからの強化学習 まとめと感想 感想 : 大規模言語モデルの評価・学習方法の変遷が興味深い 第4章 大規模言語モデルの進展 本章では,GPTなどのテキストを生成する能力を持つ大規模言語モデル…

fenfenkunの日記23日前

ChatGPTの信頼性向上のテクニック2022年の記事であるが、2024年にも生かせる内容であるため、整理しておく。 GPT-3の信頼性向上テクニックまとめ 要約 GPT-3は画期的な言語モデルですが、複雑なタスクでは期待通りのパフォーマンスを発揮できないことがあります。本稿では、GPT-3が複雑なタスクで失敗する理由を解説し、その信頼性とパフォーマンスを向上させるための多様なテクニックを紹介しています。これらのテクニックは、タスクの分割、段階的な説明の促進、推論過程の拡張、出力の検証と選択といったカテゴリーに分類できます。具体的な手法としては、「段階的に考えてみましょう」のような簡単なプロンプトの追加から、Few-Shot学習、…

虎の穴ラボ技術ブログ1ヶ月前

Assistants APIのベクターストアで大規模コード解析に挑戦!こんにちは。虎の穴ラボ エンジニアの古賀です! 今回は、OpenAIの『Assistants API』を業務(ソースコードの調査や工数の見積もり)に活用した事例を紹介します。 はじめに これを試してみようと思った経緯としては、業務で大量のPHPのソースコードファイルについて、PHPのバージョンアップに伴う作業工数の見積もりを行うことになりました。 すべて人手で調査をするととても時間が掛かることが予想されたので、その際にPythonのプログラムとAssistants APIのFile Searchを使って、ソースコードファイルの仕様や概算の必要工数を出力するCLIのプログラムを作成し、ソースコー…

AITC - ISID | AI トランスフォーメンションセンター コラム1ヶ月前

AI分野のトップ国際会議 ICML 現地参加レポートこんにちは!電通総研AITCの太田です。 普段は、社内向けChatGPTソリューション Know Narrator の開発や生成AIエージェントの研究開発をおこなっています。 2024年7月21日~27日まで、オーストリアのウィーンで開催されたAI分野の最難関の国際会議であるICMLに現地参加していました。 主な参加目的は生成AIエージェントやLLMの技術動向を調査することでした。 この記事では、ICMLで注目を集めていた研究の内容や学会の様子などをお伝えします。 ICML 2024の全体感 2024年7月21日から27日の1週間で開催されました。 開催期間中の主な内容を簡単にご紹介します。 …

MBA男子の勝手に読書ログ1ヶ月前

ChatGPTを使い尽くす! 深津式プロンプト読本(深津貴之・岩元直久)『ChatGPTを使い尽くす! 深津式プロンプト読本』(深津貴之・岩元直久)(◯) これは分かりやすい内容でした!ChaGPTにどのように指示を出せば良いのか?始めたばかりの方が持つこの疑問にポイントをわかりやすく解説してくれています。そして、自分専用のアドバイザーGPTsをどのように作っていけば良いかというあたりも、今後の楽しみの扉を開いた感じです。ChatGPTを始めた方、初心者の方にとってより発見が多く、慣れている方であれば、「自分が知らない使い方がないかなぁ」という気づきの観点でざっと見てみると参考になると思います。 (印象に残ったところ・・本書より) ◯ロールを与える ・「あなたはX…

Algomatic Tech Blog1ヶ月前

イベント運営をNotion x Slack x GASによって効率化するはじめに こんにちは。Algomatic CTO室 でインターンしている藤巻(@makiart13)です。 普段は、さまざまな業務の改善やPoCを行っています。 弊社Algomaticでは、定期的に技術系ミートアップやカンファレンスを開催しています。イベント運営は開催の1ヶ月前から準備を始め、登壇者とのコミュニケーション、会場手配、資料作成など多岐にわたるタスクが発生します。これらの作業は運営側のマインドシェアを恒常的に割きがちです。これら問題を解決するために、LLMの活用はもちろん、Slack、Notion、GASなどを活用した、イベント準備効率化ツールを作成、運用しています。 本記事では、…

LIFULL Creators Blog 2ヶ月前

LLMを利用したPlatform EngineeringKEELチーム の相原です。 これまでKEELチームではKubernetesベースの内製PaaSであるKEELを開発・運用しながら、合間で社内で汎用AI(仮)と呼ぶAutoGPT実装 keelai を開発してきました。 www.lifull.blog 我々はあくまでプラットフォーマーであり、目指すところはLLMを利用したPlatform Engineeringです。 いくつかの取り組みが実を結んできたのでここで紹介したいと思います。 APIの提供 GitHub ActionsからのLLM利用 Slack AutomationsによるLLMノーコードツールの提供 Chrome Extension…