top of page
スクリーンショット 2024-01-25 15.42.00.png

DwarfStar4で日本語の長文小説を書かせてみる

  • 執筆者の写真: Ryo Shimizu
    Ryo Shimizu
  • 3 分前
  • 読了時間: 2分

DeepSeek v4は、GPT-5に匹敵する思考能力を持っているといわれているオープンウェイトモデルです。


RoPEを用いて100万コンテキストに対応しているとのことで、これが本当にクラウドAIに匹敵する能力を持っているとすると強力な選択肢に成り得ます。


しかし、実際に100万コンテキストを処理するためには膨大な元データが必要になります。

また、実際にDeepSeek v4を動作させるためには膨大なVRAMを持つシステムが必要です。


ところがRedditの開発者が開発したds4(DwarfStar4)を使うと、継之助のサブノードであるMac Studio 512GBでDeepSeek v4 Flashを動作させることができます。


そこで実際にDeepSeek v4に日本語の長編小説を書かせてみてどのくらいの能力を持っているか測りたいと思います。

以下はDeepSeek v4 FlashをDwarfStar4で動作させて出力した6万字の原稿です。


膨大な文章量なのでこちらにアップロードできなかったのでnoteにアップロードしてあります。




これまで、ChatGPTやClaudeなどで何度も長編小説の出力に挑戦していたのですが、一発のプロンプトでここまで長くて一貫性のある文章が、しかもローカルで出力できてしまったことに大変驚いています。


そもそもChatGPTは30分も連続で作業してくれないので、これがローカルLLMの最大の強みかなと思いました。ループなどエージェンティックな処理を入れずに一発でこれがでてきています。


もともとFreeAIを創業するにあたり、GPT級のモデルがローカルで動作する時代が来ることを想定してAIスーパーコンピュータ継之助を社長として作ったのですが、ついにそういう時代が来るかもしれません。


 
 
bottom of page