CoGenAI

CoGenAIは、研究ラボやエンタープライズ向けに設計されたコラボレーティブ生成AIプラットフォームです。直感的なUIと既製のAPIコールを通じて研究グレードのAIを実用的に橋渡しし、NLPの非専門家や非コーダーがカスタムSLMとRAGパイプラインを構築・展開・提供できるようにします。

CoGenAIは現在、活発な開発と内部テストの段階にあります。テストや共同作業にご興味があれば、お問い合わせください.

CoGenAI platform, layered architecture

Platform architecture, seven horizontal layers from users to model lifecycle

機能

データ取り込みとストレージ

ドキュメント（PDF、DOCX、PPTX、画像）をMinIOオブジェクトストレージにアップロード、バケット/カテゴリ整理
ウェブドキュメント発見, arXiv、PubMed、Semantic Scholar、Brave Searchからストレージに直接検索・ダウンロード
詳細な論文分析のためのMCPサーバー統合：全文抽出、引用グラフ、コードリポジトリリンク、特許検索
同期管理付き共有データセットキャッシュ, ファイルを複製せずにデータセットをプロジェクトにリンク

処理パイプライン

リネージ追跡付きの完全バージョン管理された6つの連続ステップ
ファイルごとの品質メトリクス付きテキスト抽出（可読性、意味不明テキスト検出、言語信頼度）
同じ抽出テキストから複数のフィルターバージョンでクリーニングとフィルタリング
チャンキング, 4戦略：固定サイズ、文、段落、セマンティック（レジストリベース、拡張可能）
トークン化, 3戦略：HuggingFace BPE、文字、空白
埋め込み, sentence-transformers + OpenAI Ada、pgvectorに保存（PostgreSQLネイティブベクトル検索）
設定可能なLLMプロバイダーとモデルによるチャンクテキストからのQAペア生成

RAGと検索

エンドツーエンドRAGパイプライン：ドキュメント検索 → コンテキスト構築 → LLM回答生成
類似度スコアとチャンク表示付きFAISS/pgvector検索
実メトリクス：検索レイテンシ、取得チャンク数、回答生成レイテンシ
Prometheus/Grafanaにメトリクスをプッシュして監視

チャットとコラボレーション

設定可能なプロバイダー+モデル+RAG+エージェント切り替え、セッション永続化付きマルチターンチャット
デルタメトリクス（レイテンシ、トークン、チャンク、関連性、エージェント反復）付きモデル横並び比較
QA評価モード：進捗追跡付きで生成セットから回答済みQAペアを評価
要約、再生成、メッセージ削除；類似度スコア付きRAGチャンクパネル
楽観的送信、生成停止、マークダウンレンダリング

エージェントフレームワーク

シンプルチャット, ベースライン直接LLM呼び出し
RAGアシスタント, コンテキスト検索 + 推論ステップ付き根拠に基づく合成
ReActエージェント, 思考 → 行動 → 観察ループ、設定可能な反復回数
会話的洗練, 明確さ評価 → MCQ明確化 → 洗練されたクエリ → 回答
カスタムエージェント用テンプレートジェネレーター（レジストリベース、拡張可能）
完全に拡張可能：コアコードを変更せずにカスタムRAG戦略、チャンキングアルゴリズム、埋め込みモデル、エージェントワークフローを追加可能

モデル管理

GGUF量子化サポート、進捗追跡、検証付きHuggingFace検索・ダウンロード
一括操作付きトークナイザー+埋め込みモデルレジストリ
ローカル推論：ヘルスインジケーター付きOllama + LM Studio自動検出
APIプロバイダー：OpenAI、Anthropic、DeepSeek、Google Gemini、NVIDIA NIM、Zhipu GLM
クラウド展開：GCP Vertex AI、AWS SageMaker、Azure ML
不足/破損モデル検出と再ダウンロード

ファインチューニングとトレーニング

UnslothによるSFT/LoRA/DPOトレーニング、実GPUサポート
GPUなしの開発用シミュレーションフォールバック
トレーニングジョブ管理：設定、進捗、キャンセル、ログ、ジョブごとのGrafanaダッシュボード
トレーニング後評価：パープレキシティ、サンプル生成、ベースvsファインチューニング比較
ファインチューニング済みモデルがモデルカタログに自動登録
トレーニングメトリクス履歴をDB + Prometheusで可視化

QA検証とヒューマンインザループ

QA検証用の制限付きアクセス権を持つコントリビューターロール
コメント付き賛成/中立/反対評価
管理者タスク割り当て, コントリビューターをプロジェクトに割り当て
洗練されたデータセット：高評価QAペアをトレーニング用にエクスポート（SFT、DPO、RLHF）
完全なフィードバックループ：検証 → 洗練されたデータセット → ファインチューニング

デプロイメント

ローカルデプロイ：vLLM / Ollama Dockerコンテナ
クラウドデプロイ：GCP Vertex AI、AWS SageMaker、Azure ML
組み込みチャットインターフェースによるモデル推論テスト

メトリクスとモニタリング

Prometheus + Pushgateway + Grafanaスタック、トレーニング/RAG/処理にわたる11の登録メトリクス
3つの自動プロビジョニングGrafanaダッシュボード：トレーニング（損失曲線、期間、進捗）、RAG（レイテンシ、チャンク、クエリ/秒）、システム（ヘルス、スクレイプステータス）
モジュラー@register_metricデコレーター, metrics/builtin/にクラスを追加するだけで新しいメトリクスを登録
管理API：登録メトリクスの一覧表示、PromQLプロキシ経由のPrometheusクエリ、Pushgatewayデータの削除
5タブ（概要、値、Pushgateway、PromQL、削除）+ステータスカード付きフロントエンドダッシュボード

プラットフォームインフラストラクチャ

ロールベースアクセス制御：super_admin > admin > researcher > contributor
バックアップと復元：PostgreSQL、MinIO、スケジューラーとメモ付きワークスペース
データベース：pgvector拡張付きPostgreSQL 16
タスクキュー：すべての重い処理にCelery + Redis
コンテナ化：4つのMCPサイドカーを含む15以上のサービスを持つDocker Compose
折りたたみサイドバー、グラデーション統計カード、デザインシステム抽象化レイヤー付きレスポンシブフロントエンド

デモをリクエスト