DeepSeek-V3徹底解剖:671BスケールのMoE×FP8で挑む最新LLM!ロードバランス革命と高性能の秘密に迫る
こんにちは、ゆずかきです。
ここからは、「DeepSeek-V3」 と呼ばれる最新の大規模言語モデル(LLM)について、論文をもとに技術ブログとしてまとめてみたいと思います。
今回紹介する「DeepSeek-V3」 ...
DeepSeek R1徹底解説:強化学習のみでLLMの多段推論がここまで進化!話題のAIモデルを論文解説
タイトル:DeepSeek R1 徹底解説:純粋な強化学習でLLMの推論能力を引き出す最先端アプローチ!
こんにちは、ゆずかきです。
ここからは、「DeepSeek R1」 と呼ばれる、最新の大規模言語モデル(LL ...
“Scheduled Tasks in ChatGPT” Comprehensive Guide: ChatGPT’s “Scheduled Tasks” Feature Finally Enters Beta! A Wide Range of Automation and Reminder Options Are Now Available
Hello, this is Yuzukaki.
In this post, I’ll provide a detailed explanation of “Scheduled Tasks in ChatGPT”, the l ...
「Scheduled tasks in ChatGPT」徹底解説:ChatGPTの「Scheduled Tasks」機能がついにベータ公開!多彩な自動化・リマインダー活用が可能に!
こんにちは、ゆずかきです。
ここでは、「OpenAIの最新リリース」 である 「Scheduled tasks in ChatGPT」 について、公開されているリリース情報を可能な限り網羅しつつ、詳細をわかりやすく解説してみた ...
MP(Metacognitive Prompting)徹底解説:人間の“内省”をLLMに宿す!CoTを超える自己監視の実力とは
こんにちは、ゆずかきです。
ここからは、「Metacognitive Prompting(MP)」 と呼ばれる最新の手法について、論文
「Metacognitive Prompting Improves Under ...
Demystifying Language Model Forgetting徹底解説:低ランク行列で読み解くLLMの忘却
こんにちは、ゆずかきです。
今回は、「Demystifying Language Model Forgetting with Low-Rank Example Associations」 という2024年12月付のarXiv論 ...
Evolutionary Model Merge徹底解説:SakanaAIが導く進化的アルゴリズムでLLMを“合体”させる新時代
こんにちは、ゆずかきです。
今回は、「Evolutiona ...
LLM-jp徹底解説:日本語LLMをオープンソースで作り上げる壮大プロジェクト
こんにちは、ゆずかきです。
今回のブログ記事では、「LLM-jp(エルエルエム・ジェイピー)」 という、日本国内外で注目されているオープンソースの大型言語モデル(LLM)開発プロジェクトについて解説したいと思います。 ...
長考するGPT4oがプロンプトを生成!?生成AIの思考プロセスを導くアプローチ
こんにちは!ゆずかきです。
今回は、私がGPTで遊び得た経験を、ブログの形にて書かせていただきます。
この記事では、GPTがどうやって長考するようになる ...
問いを超えるAIの設計――自ら長考するGPTが描く未来
こんにちは。ゆずかきです。
今回は「長考するGPT」についてお話しします。
GPTに質問したとき、「うん、それはわかるけど、もう少し背景を理解してほしい」と思ったり、「次にどうすればいいか具体的に教えてほ ...