利用 cloud studio で構築したプライベート知識庫
Cloud Studio + ollama + deepseek + nomic-embed-text + anythingllm + プライベート知識 === ai プライベート知識庫
必要なことは実際に上でほぼ伝えられていますので、操作を始めましょう。
まずは私たちの古い友達Cloud Studioを開きます。今、私たちの中には cloud studio を cs と略称する人もいます。cs が大きく成長し、再び輝かしい成果を上げることを願っています。私たちの地元の colab を作り上げましょう。
引き続きホームページのバナーを選択し、32b モデルを直接選択します。
リソースの割り当てを待ち、起動します。
完了後は以下の図のようになります。
cloud studio はすでに anythingllm を内蔵しています。もし自分のローカルコンピュータにインストールして使用したい場合は、anythingllm をダウンロードしてインストールする必要があります。もちろん、単に簡単に体験したいだけなら、ダウンロードする必要はなく、cs が提供する内蔵 web を直接使用すれば大丈夫です。
私たちはブラウザで内蔵の anythingllm ページを開くだけで良いのです。
deepseek-r1:32b を引き出すこのステップは省略できます。なぜなら cs がすでにモデルをダウンロードしてくれているからです。ただし、32 のプランを選択した場合に限ります。もし 32b を使用する必要がある場合は、ollama pull deepseek-r1:32b
をダウンロードして引き出す必要があります。
nomic-embed-text を引き出すにはollama pull nomic-embed-text
を実行します。
ローカルで使用する場合は、anythingllm クライアントをダウンロードしてください。
初期化を開きます。
anythingllm をローカルにインストールしている場合のみ初期化が必要です。cloud studio を使用する場合は、デフォルトで初期化されています。ただし、上記の引き出しは必ず cloud studio のターミナルで実行してください。速度は少し遅くなるかもしれませんが、リソースは海外のサーバーにあるためです。
開始をクリックします。
下にスクロールして ollama を選択します。
前回の記事で言った ollama を使って deepseekr1 をデプロイして API を提供することを覚えていますか?ここでの URL は API アドレスを入力する必要があります。どう入力するかわからない場合は、cloud studio を開いてポートをクリックします。
どのポートが ollama サービスを提供しているかを確認し、小さな地球をクリックして新しいページを開きます。
ここでの URL をコピーします。私のはhttps://ottzkl-pkzulq-8434.app.cloudstudio.work です。anythingllm のクライアントに貼り付けます。
注意してください。URL の後ろのスラッシュを必ず削除してください。スラッシュなしで、https://ottzkl-pkzulq-8434.app.cloudstudio.work です。
URL を入力すると、上のモデルが自動的に認識されます。適切なモデルを選択するために下にスクロールします。例えば、32b を選択します。他のパラメータはデフォルトのままで大丈夫です。パラメータの変更はこの記事の範囲外です。
その後、初期化が完了するまで次へ進みます。
簡単な設定を始めましょう。
アイコンの小さなスパナをクリックします。
2025/2/17 15:20
この時の操作は web ページの操作と一致しています。
embedder をクリックして、埋め込みの優先設定を選択します。
ollama を選択し、以前の API アドレスと同じアドレスを貼り付け、nomic-embed-text を選択して変更を保存します。
小さなスパナの位置をクリックすると、今は戻る矢印になります。クリックしてホームページに戻ります。
ホームページで新しいワークスペースを作成します。
ワークスペースの名前を入力し、保存をクリックします。
まず、テストして deepseek が正常に呼び出せるか確認します。
ok、正常です。私たちが作成したワークスペースの隣にあるアップロードボタンをクリックして資料をアップロードします。
サポートされているファイル形式は多く、txt、doc、csv、xls、docx、xlsx、pdf、URL などがあり、音声や動画ファイルもサポートしています。テキストファイルの形式が最適で、認識がより便利で迅速かつ正確です。
私はここで適当にいくつかの pdf ファイルをインターネットで探しました。
ドラッグ&ドロップして、すべて選択し、ワークスペースに移動します。
下にスクロールして保存を選択します。
少し待って、ワークスペースのデータをアップロードして更新します。
成功のメッセージが表示されたら、アップロードしたファイルにピンを付けることができます。これにより、私たちの資料が優先的に呼び出されます。
ダイアログを閉じて、質問を行います。
hide citations をクリックすると、現在引用している資料が表示されます。
これで、プライベート知識庫の構築が完了しました。