CoGenAI

CoGenAIは、研究ラボやエンタープライズ向けに設計されたコラボレーティブ生成AIプラットフォームです。直感的なUIと既製のAPIコールを通じて研究グレードのAIを実用的に橋渡しし、NLPの非専門家や非コーダーがカスタムSLMとRAGパイプラインを構築・展開・提供できるようにします。

CoGenAIは現在、活発な開発と内部テストの段階にあります。テストや共同作業にご興味があれば、お問い合わせください.

CoGenAI platform, layered architecture

Platform architecture, seven horizontal layers from users to model lifecycle

機能

データ取り込みとストレージ

  • ドキュメント(PDF、DOCX、PPTX、画像)をMinIOオブジェクトストレージにアップロード、バケット/カテゴリ整理
  • ウェブドキュメント発見, arXiv、PubMed、Semantic Scholar、Brave Searchからストレージに直接検索・ダウンロード
  • 詳細な論文分析のためのMCPサーバー統合:全文抽出、引用グラフ、コードリポジトリリンク、特許検索
  • 同期管理付き共有データセットキャッシュ, ファイルを複製せずにデータセットをプロジェクトにリンク

処理パイプライン

  • リネージ追跡付きの完全バージョン管理された6つの連続ステップ
  • ファイルごとの品質メトリクス付きテキスト抽出(可読性、意味不明テキスト検出、言語信頼度)
  • 同じ抽出テキストから複数のフィルターバージョンでクリーニングとフィルタリング
  • チャンキング, 4戦略:固定サイズ、文、段落、セマンティック(レジストリベース、拡張可能)
  • トークン化, 3戦略:HuggingFace BPE、文字、空白
  • 埋め込み, sentence-transformers + OpenAI Ada、pgvectorに保存(PostgreSQLネイティブベクトル検索)
  • 設定可能なLLMプロバイダーとモデルによるチャンクテキストからのQAペア生成

RAGと検索

  • エンドツーエンドRAGパイプライン:ドキュメント検索 → コンテキスト構築 → LLM回答生成
  • 類似度スコアとチャンク表示付きFAISS/pgvector検索
  • 実メトリクス:検索レイテンシ、取得チャンク数、回答生成レイテンシ
  • Prometheus/Grafanaにメトリクスをプッシュして監視

チャットとコラボレーション

  • 設定可能なプロバイダー+モデル+RAG+エージェント切り替え、セッション永続化付きマルチターンチャット
  • デルタメトリクス(レイテンシ、トークン、チャンク、関連性、エージェント反復)付きモデル横並び比較
  • QA評価モード:進捗追跡付きで生成セットから回答済みQAペアを評価
  • 要約、再生成、メッセージ削除;類似度スコア付きRAGチャンクパネル
  • 楽観的送信、生成停止、マークダウンレンダリング

エージェントフレームワーク

  • シンプルチャット, ベースライン直接LLM呼び出し
  • RAGアシスタント, コンテキスト検索 + 推論ステップ付き根拠に基づく合成
  • ReActエージェント, 思考 → 行動 → 観察ループ、設定可能な反復回数
  • 会話的洗練, 明確さ評価 → MCQ明確化 → 洗練されたクエリ → 回答
  • カスタムエージェント用テンプレートジェネレーター(レジストリベース、拡張可能)
  • 完全に拡張可能:コアコードを変更せずにカスタムRAG戦略、チャンキングアルゴリズム、埋め込みモデル、エージェントワークフローを追加可能

モデル管理

  • GGUF量子化サポート、進捗追跡、検証付きHuggingFace検索・ダウンロード
  • 一括操作付きトークナイザー+埋め込みモデルレジストリ
  • ローカル推論:ヘルスインジケーター付きOllama + LM Studio自動検出
  • APIプロバイダー:OpenAI、Anthropic、DeepSeek、Google Gemini、NVIDIA NIM、Zhipu GLM
  • クラウド展開:GCP Vertex AI、AWS SageMaker、Azure ML
  • 不足/破損モデル検出と再ダウンロード

ファインチューニングとトレーニング

  • UnslothによるSFT/LoRA/DPOトレーニング、実GPUサポート
  • GPUなしの開発用シミュレーションフォールバック
  • トレーニングジョブ管理:設定、進捗、キャンセル、ログ、ジョブごとのGrafanaダッシュボード
  • トレーニング後評価:パープレキシティ、サンプル生成、ベースvsファインチューニング比較
  • ファインチューニング済みモデルがモデルカタログに自動登録
  • トレーニングメトリクス履歴をDB + Prometheusで可視化

QA検証とヒューマンインザループ

  • QA検証用の制限付きアクセス権を持つコントリビューターロール
  • コメント付き賛成/中立/反対評価
  • 管理者タスク割り当て, コントリビューターをプロジェクトに割り当て
  • 洗練されたデータセット:高評価QAペアをトレーニング用にエクスポート(SFT、DPO、RLHF)
  • 完全なフィードバックループ:検証 → 洗練されたデータセット → ファインチューニング

デプロイメント

  • ローカルデプロイ:vLLM / Ollama Dockerコンテナ
  • クラウドデプロイ:GCP Vertex AI、AWS SageMaker、Azure ML
  • 組み込みチャットインターフェースによるモデル推論テスト

メトリクスとモニタリング

  • Prometheus + Pushgateway + Grafanaスタック、トレーニング/RAG/処理にわたる11の登録メトリクス
  • 3つの自動プロビジョニングGrafanaダッシュボード:トレーニング(損失曲線、期間、進捗)、RAG(レイテンシ、チャンク、クエリ/秒)、システム(ヘルス、スクレイプステータス)
  • モジュラー@register_metricデコレーター, metrics/builtin/にクラスを追加するだけで新しいメトリクスを登録
  • 管理API:登録メトリクスの一覧表示、PromQLプロキシ経由のPrometheusクエリ、Pushgatewayデータの削除
  • 5タブ(概要、値、Pushgateway、PromQL、削除)+ステータスカード付きフロントエンドダッシュボード

プラットフォームインフラストラクチャ

  • ロールベースアクセス制御:super_admin > admin > researcher > contributor
  • バックアップと復元:PostgreSQL、MinIO、スケジューラーとメモ付きワークスペース
  • データベース:pgvector拡張付きPostgreSQL 16
  • タスクキュー:すべての重い処理にCelery + Redis
  • コンテナ化:4つのMCPサイドカーを含む15以上のサービスを持つDocker Compose
  • 折りたたみサイドバー、グラデーション統計カード、デザインシステム抽象化レイヤー付きレスポンシブフロントエンド
デモをリクエスト