ohai.social is one of the many independent Mastodon servers you can use to participate in the fediverse.
A cozy, fast and secure Mastodon server where everyone is welcome. Run by the folks at ohai.is.

Administered by:

Server stats:

1.8K
active users

#開源分享

7 posts4 participants0 posts today

#開源分享 一句話創建智慧體的工具:Cooragent,可與其他智慧體協作完成複雜的任務,支持MCP

有兩種工作模式:
1、Agent Factory:
只需描述,Cooragent就會根據需求生成一個智慧體,其自動分析需求,透過記憶和擴展深入理解用戶需求,挑選合適的工具自動打磨Prompt,逐步完成智慧體構建

2、Agent Workflow:
只需描述目標任務,Cooragent會自動分析任務需求,挑選合適的智慧體進行協作

提供CLI工具,可以快速創建,編輯,刪除智慧體

專案地址: github.com/LeapLabTHU/cooragent

#開源分享 這款“白板+代碼編輯器”的組合工具火了,pad.ws

它把白板和IDE合二為一,開發者可以在同一界面裡畫圖和編程,實現邊畫邊寫程式碼,在視覺化構思和編程之間無縫切換

用Excalidraw作為白板界面,Coder提供雲端開發環境
支持VS Code、Cursor等

專案地址: github.com/pad-ws/pad.ws

#開源分享 微軟髮布了一個文件轉換MCP:markitdown-mcp,用於將網頁連結(http/https)、本地文件以及數據轉換為Markdown格式!

主要是調用MarkItDown進行格式轉換。可以通過Docker運行或直接安裝,也可以與Claude等AI工具集成使用

專案地址: github.com/microsoft/markitdown/tree/main/packages/markitdown-mcp

#開源分享 基於人類大腦工作原理設計的一款AI記憶系統:HawkinsDB,讓AI可以像人類一樣儲存和回憶資訊

它基於Jeff Hawkins的“千腦理論”,幫助AI模型以更強大且直觀的方式管理複雜資訊

想像一下我們的大腦,不僅僅是記住一堆零散的事實,而是將它們關聯起來形成一個複雜的知識網路,HawkinsDB就是想讓AI也能像人類大腦一樣記憶和理解資訊

HawkinsDB不依賴於模糊的相似性搜索,而是支持精確的,具備上下文感知的查詢,理解數據的實際含義和關係

它將語義記憶、情景記憶和程序記憶統一到一個框架中,使AI能像知識圖譜一樣,不僅儲存資訊,還記錄資訊之間的關係,從而理解和應用不同類型的知識

可作為LLM應用的記憶層,比較適用於RAG系統

專案地址: github.com/harishsg993010/HawkinsDB

#開源分享 微軟開源了一個基於《當個創世神》的即時開源互動式世界模型:MineWorld,它可以根據玩家的動作預測遊戲世界接下來的變化,並即時生成新的遊戲畫面

它的核心是一個視覺動作自回歸Transformer模型,它接收遊戲場景和對應玩家動作的配對數據作為輸入,預測接下來的新場景

預測速度非常快,可以做到即時更新

它研發了一種新的並行解碼算法,可以同時預測每一幀中空間冗餘的 token,使不同規模的模型能夠達到每秒生成4到7幀的速度,實現與玩家的即時交互

專案地址: github.com/microsoft/MineWorld

#開源分享 把Claude的工具能力移植到本地模型的Ollama MCP工具:ollama-mcp-bridge

使本地AI助手具備文件操作、網路搜尋、郵件以及文件管理、代碼和GitHub交互、圖像生成以及持久記憶體等能力

支持多個MCP,具備動態工具路由功能,支持結構化的輸出驗證,可根據提示自動檢測工具

專案地址: github.com/patruff/ollama-mcp-bridge

#開源分享 具備記憶能力的一款審批自動化AI工具:LLManager,可以用它做智慧審批管理系統
比如人力資源審批,文字內容審批,或者貸款資質審批等

核心特點是它可以透過反思和學習不斷改進自己的決策能力,從人工修正中學習,通過自我反思總結經驗

在決策時會參考歷史類似案例,可以解釋判斷理由,並基於LLM對上下文的分析進行更細緻的判斷,並非簡單的“是/否”判斷

設有人工干預機制,支持詳細的推理過程

專案地址: github.com/langchain-ai/llmanager

#開源分享 分享一款強大的可視化主題編輯工具:tweakcn。

它能幫助我們以可視化方式訂製 Tailwind CSS 和 shadcn/ui 組件,讓網站界面擺脫千篇一律的風格。

專案地址: github.com/jnsahaj/tweakcn

主要功能:

- 提供 300+ 種美觀的主題預設,快速應用個性化風格
- 可視化編輯 Tailwind CSS 主題配置
- 解決 shadcn/ui 組件千篇一律的視覺問題
- 即時預覽主題變化效果

如果你正在開發一個網站,這個開源工具也許能幫助我們構建一個精美的網站。

#開源分享 一款開源的AI影片筆記生成工具:BiliNote,支持從Bilibili、YouTube等平台影片自動生成筆記

可自動提取內容生成結構清晰的Markdown格式筆記,支持插入截圖、原片跳轉等功能

支持使用本地模型(比如Fast-Whisper)進行音訊轉寫,支持多種LLM (OpenAI、DeepSeek、Qwen)

專案地址: github.com/JefferyHcool/BiliNote

#開源分享 程式設計師工具,一款開源的輔助代碼定位的工具:LocAgent,它通過圖結構引導LLM進行程式碼定位

就是把代碼庫解析為有向異構圖,讓LLM在圖上搜索和推理,利用圖結構和LLM的推理能力,準確定位代碼

支持 LLM 通過多跳推理進行程式碼定位

使用微調後的Qwen-2.5-Coder-Instruct-32B,LocAgent 在文件級定位上達到了92.7% 的準確率,相比現有的SOTA專有模型,成本降低了約86%

專案地址: github.com/gersteinlab/LocAgent

#開源分享 讓AI訪問微信聊天記錄的MCP:chatlog,支持Windows/macOS系統和微信3.x/4.0版本

可以從本地資料庫文件中提取微信聊天記錄,提供一個簡單的命令行界面,也能透過終端菜單操作

也可以通過API查詢聊天記錄、聯絡人、群聊和最近會話等

支持MCP SSE,對不支持MCP SSE協議的AI助手,可以使用mcp-proxy工具進行請求轉發

專案地址: github.com/sjzar/chatlog

#開源分享 基於MCP的技術文件處理神器:DevDocs,程式設計師搭檔

DevDocs自動抓取指定網站的技術文件,整理成清晰的結構化數據,通過內建的MCP伺服器供AI工具快速尋找資訊

支持智慧抓取,可配置抓取深度、自動發現連結、選擇性抓取和子URL檢測

支持平行處理,具有智慧快取功能,支持MD和JSON格式導出

可輕鬆集成到Cursor、Windsurf、Cline、Roo Code、Claude Desktop App等工具中

專案地址: github.com/cyberagiinc/DevDocs

#開源分享 把任意網站變成MCP伺服器的一個項目:sitemcp

sitemcp會抓取網站內容並快取,支持使用micromatch指定抓取的頁面路徑以及CSS選擇器來精細化選擇頁面內容,並把抓取的內容用作MCP伺服器的數據源

它等於是把靜態網站變成了一個可交互的知識庫,配合MCP用戶端進行提問,解鎖了更豐富的應用場景

專案地址: github.com/ryoppippi/sitemcp

#開源分享 端到端自動化科學發現系統:CodeScientist,可以幫助科學人員設計、運行以及分析代碼形式的科學實驗

CodeScientist從科學文章和代碼範例中生成新的實驗想法

它可以自動創建實驗代碼,並在安全的環境中運行和除錯實驗代碼,實驗完成後會生成詳細的實驗報告

可以手動,輸入實驗想法,選擇代碼片段並指導實驗運行;也可以自動,自主生成實驗想法並運行實驗

支持同時執行多個實驗,這使得可以高效進行大規模科學實驗

專案地址: github.com/allenai/codescientist

#開源分享 具備MCP能力的Neovim插件:mcphub.nvim,基於MCP,可以直在Neovim裡使用各種智慧工具

提供了一個直觀的用戶界面,來瀏覽、安裝測試工具及資源,支持多種原生MCP伺服器,自帶了一些常用的 MCP 伺服器

集成了Avante.nvim、Codecompanion 等Neovim 聊天插件,以及MCP市場,支持互動式測試

專案地址: github.com/ravitemer/mcphub.nvim

#開源分享 基於MCP構建的一個可處理複雜文件的RAG系統的用例

用Cursor作為MCP用戶端,GroundX來構建能處理複雜文件的MCP伺服器,用戶在Cursor中提問,系統通過 GroundX在文件庫中進行語義搜尋,並將相關資訊返回給 Cursor,Cursor生成並呈現最終答案

Cursor負責用戶交互,GroundX負責文件處理,形成完整的問答鏈路

工作流:
用戶通過 MCP 用戶端Cursor進行交互
用戶端連接到MCP伺服器並選擇工具
工具利用GroundX對文件進行高級搜尋
用戶端使用搜索結果生成響應

可以用來做企業知識庫問答、科研文獻檢索、客戶支持或教育學習等等

專案地址: github.com/patchy631/ai-engineering-hub/tree/main/eyelevel-mcp-rag

#開源分享 GitHub倉庫的一個得力搜索助手:DeepGit,可以幫助你深度搜索/發現GitHub上的優質倉庫

核心是能理解用戶的模糊查詢,自動擴展和完善搜索關鍵字,做智慧分析,分析倉庫的文件、分析代碼結構以及技術棧,評估社區活躍度

會結合多個維度給出相關性評分,提供排序後的推薦列表

專案地址: github.com/zamalali/DeepGit

#開源分享 一站式影片多語言轉換工具:Krillin AI,集影音翻譯、配音、語音複製於一體

影片輸入到輸出自動化,一鍵完成字幕提取、翻譯、配音、影片合成

支持B站,小紅書,抖音,影片號,快手,YouTube,TikTok等多個平台

輸入支持中,英,日,德,土耳其語等
輸出支持中英俄法等56種語言翻譯

可本地部署,是內容創作者們比較實用的一款工具

專案地址: github.com/krillinai/KrillinAI

#開源分享 Meta開源了Llama 4,單個NVIDIA H100 GPU可運行,千萬token上下文窗口

Llama 4首次採用MoE架構,原生支持文本、圖像、影片等多模態,給AI 裝上了”眼睛“和“最強大腦”,支持200種語言,比Llama 3多了10倍的多語言訓練數據

Llama 4系列首批放出了三個型號
1、Llama 4 Scout
17B活躍參數,16個專家
單張H100 GPU就能運行
支持10M超長上下文窗口
優於Gemma 3、Gemini 2.0 Flash-Lite、Mistral 3.1

2、Llama 4 Maverick
17B活躍參數,128個專家
總參數量400B
性能超過GPT-4o、Gemini 2.0 Flash
推理和編程能力與DeepSeek v3相當,活動參數不到其一半