oLLM 这个轻量化推理库,专为消费级 GPU 优化,用 8GB 显存就能跑 80B 参数的大模型。
通过巧妙的内存管理策略,将模型权重和 KV 缓存分层加载到 GPU 和硬盘,再配合 FlashAttentio …
通过巧妙的内存管理策略,将模型权重和 KV 缓存分层加载到 GPU 和硬盘,再配合 FlashAttentio …
不仅能准确识别复杂的科学公式和化学结构,还能自动过滤页眉页脚等无关内容,专注提取核心信息。 GitHub:ht …
阿里技术团队,最近开源了一个端到端文档解析模型: Logics-Parsing,可以将复杂文档直接转换为结构化的 HTML 格式。 查看全文 »
很简单配置一下就可以打包出来,基本够用,这样你可以很方便把你写的命令行工具分享给到不懂技术的小伙伴使用,PS …
系统设计以性能和可扩展性为核心,支持多频道多插件并发搜索、结果智能排序和网盘类型分类。docker集成前后端, …
最近在 GitHub 上找到了 OBS-Zoom-To-Mouse 这个开源的 OBS 插件,可让 OBS 自 …
OpenAI 刚发了“Prompt Packs” ↳ 300+ 精选提示 Prompt ↳ 12 个大类(IT …
每隔 3 小时自动更换一次壁纸,同时会在壁纸上叠加一个随机英语单词(来源于 CET-4、GRE 词库)。 Gi …
https://github.com/eduardolat/pgbackweb
只需要提供提供频道的 URL,就能自动下载音频并生成 RSS 链接,支持自动同步更新。 GitHub:http …
GitHub 上看到一个叫 PigeonPod 的开源工具,可以将自己喜欢的 YouTube 频道转为播客订阅,在上班路上或空闲时间就能收听内容。 查看全文 »
无独有偶,在 GitHub 上发现了 FlyCut Caption 这款强大的 AI 字幕处理工具。 基于 W …