数日前、Kimi Cliの年間会員に加入し、よく使うシナリオの体感をテストしました。以下はその結果です。



1️⃣ ソフトウェアのインストールを手伝ってもらいました。Macにインストールする場合、例えば网易云音乐のようなソフトウェアは、DMGファイルを完全にダウンロードしてインストールを実行できました。完成度:🌟🌟🌟

2️⃣ Gmailのメール整理を依頼しました。このケースでは、私のメールが30,000通以上と多いため、Kimiはしばしば途中で整理を続けるかどうかの確認を求めてきました。私は「続けて良い」と伝えているのに、確認を求め続けるため、長期にわたるタスクではTokenの消費やRLの誘導の問題により、長期固定タスクのパフォーマンスにはやや不満が残ります。完成度:🌟

3️⃣ 適した仕事を探してもらいました。私は自分の履歴書を渡し、Kimiに全ネットから適した仕事を探してもらいました。提案は非常に良かったのですが、欠点は具体的なポジション情報がなく、最大でも会社名までしかわからない点です。職種のバリエーションも大きく、優秀な例はWorld Labsですが、あまり知られていない東欧の会社も含まれていました。ここではTool useの能力がモデルの能力を制限している可能性があり、方向性の指針としては非常に良いものの、実際に具体的な誘導を行うにはまだ改善の余地があります。完成度:🌟🌟

4️⃣ 旅行の行程計画を依頼しました。目的が明確でないタスクのシナリオでは、今後5日間の英国でのサッカー観戦、実家での休養、日本旅行の中から状況に応じて提案を出してもらいました。この部分の体験はあまり満足できず、提案も漠然としており、私の意図を追求する過程もありませんでした。Claude Codeのように、多目的の曖昧な最適化タスクの定義においては、複数回にわたり3つの選択肢を提示して収束させることができる点と比較すると、Kimi Cliはこの点を強化すべきです。完成度:🌟🌟

全体的に見て、私はKimi Cliは非常に能力の高い働き手だと感じています。仕事に対しては任せきりで一生懸命やってくれますが、固定されたタスクでは常に私に確認を求め、非固定のタスクでは自由に発揮します。この点に少し戸惑いを感じており、@Kimi_MoonshotにはAgentic RLを用いた体験の最適化が急務だと考えています。それ以外の日常的な部分については非常に驚かされました。PDFの要約、ローカルでのスクリプト作成、スケジュール管理など、これらのおかげで年間会員に加入した価値は十分にあったと感じています。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン