Posts filter


Video is unavailable for watching
Show in Telegram
PageLM:AI驱动的教育学习平台

这是一个开源AI教育平台,将学习材料转化为互动体验,支持上下文聊天、智能笔记、闪卡、测验等功能,兼容多AI模型与嵌入服务,通过WebSocket实时生成内容,采用Docker部署且支持本地开发。

✨重点
●📚【核心功能】上下文聊天(上传文档问答)、智能笔记(Cornell格式自动生成)、闪卡(间隔重复)、测验(带提示与评分)、AI播客(语音学习)、作业规划、考试模拟、辩论功能
●🔄【多模型支持】兼容Google Gemini、OpenAI GPT、Anthropic Claude、xAI Grok、Ollama(本地)、OpenRouter等LLM
●⚙️【技术栈】后端Node.js+TypeScript+LangChain,前端Vite+React+TailwindCSS,支持JSON/向量数据库存储,Markdown结构化输出
●🚀【部署方式】Docker一键部署(开发/生产环境),本地需Node.js v21.18+、ffmpeg,支持WebSocket实时流处理
●🎙【音频功能】集成Edge TTS、ElevenLabs、Google TTS生成播客,支持语音转录与学习材料整理
●🔍【数据安全】文件上传基于本地存储,环境变量配置敏感信息,支持自定义文件大小限制
●📝【学习工具链】提供AI辩论伙伴、Cornell笔记模板、考试模拟反馈,适合教育工作者与学习者
●🔧【开发指南】含详细本地开发步骤(克隆仓库→配置.env→启动前后端),支持Windows/Linux跨平台部署


线性代数英文原版+中文版 | #电子书


MIT终身教授、美国国家科学院院士Gilbert Strang继全球畅销教材《线性代数导论》后,推出硬核新作《线性代数与数据学习》

豆瓣评分9.3,清华/MIT等顶尖学府指定教材


The Well: 15TB of Physics Simulations

物理仿真数据集规模空前,涵盖生物系统、流体力学、声波散射、磁流体动力学等多领域。The Well 提供了总量达15TB的高质量物理模拟数据,方便机器学习和计算科学研究者做模型训练与评估。

项目集成16个不同数据集,支持直接下载或从 Hugging Face 流式访问,配合PyTorch接口可轻松加载训练。还提供基准模型和训练脚本,助力科研人员快速验证和改进物理场的数值模拟与PDE代理模型。

主要特点:

- 涵盖多种物理领域的高精度仿真数据,数据规模达15TB;
- 提供易用的Python接口,支持分布式训练和数据流式加载;
- 包含基准测试和预训练模型,方便性能对比和模型迭代;
- 支持本地下载和云端流式访问,灵活适配不同计算环境;
- 由多所知名科研机构联合开发,质量和权威性有保障。

适合机器学习研究者、物理模拟开发者和计算科学团队,推动跨学科AI科研创新。


All In One USB Drive | #工具

多合一启动U盘工具集,集合了各种系统安装器、救援工具和实用程序,方便随时应对各种电脑维护和系统重装需求。支持将多个ISO镜像整合到一个U盘,通过Ventoy实现直接启动,操作简单,更新灵活。

主要功能:

- Linux系统救援套件和磁盘镜像工具;
- 多种主流Linux发行版和Windows安装镜像;
- Windows及Office激活脚本支持;
- 详细步骤指导,轻松制作和使用多启动U盘;
- 支持常见平台格式,满足不同场景需求。


十年前的一本多语言版的逆向工程权威指南,含中文版 | #电子书


Machine Learning Engineering Open Book(机器学习工程开放书)

Stas Bekman创建并维护的一份开源技术指南。该项目旨在收集和分享关于大语言模型及多模态模型训练、微调和推理的实用方法论、工具及详细步骤。| #指南

内容从底层硬件(计算加速器、CPU、内存)到软件基础设施(文件存储、网络、SLURM 调度系统)的各个层面,特别关注在大规模分布式系统中遇到的调试、优化和测试等工程难题。

对于希望深入了解如何构建高效 ML 训练集群或解决实际训练崩溃问题的机器学习工程师和研究人员来说,这是一份极具价值的实战手册。




爱丽丝漫游可微仙境:Alice’s Adventures in a differentiable wonderland | #电子书

这是本一路用直观的语言和可运行的代码教会你亲手构建现代神经网络的书。“神经网络无处不在——大型语言模型、语音转写、分子发现算法、机器人系统……剥开外衣,它们都只是可微基元的组合;研究神经网络,就是在学习如何“编程”并与这些模型交互,这正是所谓的“可微编程”。

这本入门读物,为像爱丽丝一样刚刚跌入这片奇异可微仙境的你而写。我将概览如何通过自动微分来优化函数,并精选最常见的架构来处理序列、图、文本与音频。

全书聚焦直觉、自成体系地介绍最重要的设计技巧——卷积块、注意力块、循环块——力求在理论与代码(PyTorch 与 JAX)之间架起桥梁,使读者最终能够理解当今最前沿的模型,如大语言模型 (LLM) 与多模态架构。”

作者现在开始写第二卷了,先放出了一章介绍强化学习的:内容涉及大型语言模型的后训练技术,聚焦于强化学习在模型微调中的作用 。内容兼具广度(历史演进)与深度(数学推导)的技术文档。系统讲解了从奖励建模(Reward Modeling)、策略梯度(Policy Gradient)到PPO、GRPO及DPO等前沿算法的数学推导与应用细节 。


Intelligent Robot Simulator (IR-SIM) 是一款基于 Python 的轻量级机器人仿真器,专注于导航、控制和强化学习的快速验证。与那些功能强大但臃肿的机器人模拟器不同,IR-Sim 不依赖复杂的物理引擎,适合快速搭建和测试算法。

IR-Sim 的核心优势:
- 安装快捷,配置简单
- 场景用 YAML 文件定义,易于管理
- 使用 Matplotlib 实时可视化
- 内置碰撞检测,支持多机器人避障
- 适合 AI 和强化学习的开发流程

它能帮你快速原型设计多机器人避障、基于激光雷达的导航、动态障碍物环境下的行为测试,甚至在进入大型仿真平台前完成高层次的算法验证。

该项目开源且活跃维护,已有多篇导航与规划领域的科研论文采用它。对于学生、研究者或导航算法爱好者,IR-Sim 是一种无需庞大依赖,快速试验想法的极佳工具。

技术选择不仅关乎功能, 更是效率和灵活性的权衡。简化工具链,聚焦核心需求,才能让创新更快落地。


Video is unavailable for watching
Show in Telegram
Google Labs 推出全新实验项目“Disco”,开启探索生成式AI功能的全新体验。首个功能GenTabs,借助Gemini 3技术,将你打开的网页标签页重新组合,打造个性化定制的网络应用,帮助你更高效利用网络资源。

这不仅是AI能力的叠加,更是工作流程的变革。GenTabs能够整合你不同网页信息,如旅行计划、购物清单,实现智能推荐和协同操作,极大提升生产力和协作体验。

Google正悄然将AI深植于互联网底层,打造人人可用的定制化智能应用,这不仅是技术创新,更是数字生活方式的升级。未来,浏览器将不再只是信息载体,而是你的智能助手和创作平台。


Alex Albert 正在征集 Opus 4.5 的反馈,用户们纷纷指出了使用中的痛点和改进建议:帖子

- 上下文限制频繁导致查询失败,界面空白,且离开页面后常丢失输入(Deedy)
- 模型偶尔过于急于下结论,忽略指令,且有时回答直觉化,缺乏严格核查
- 需要更强的“长上下文智能”,能提炼主题、战略方向,而非简单检索- UI体验欠佳,比如无法在会话中切换Sonnet和Opus,自动压缩功能不可控,浪费时间和资源
- 性能和成本问题,期望更快更便宜
- 代码生成时常忽视已有抽象,重复造轮子;合并冲突处理不够智能,导致等待CI失败
- 安全研究场景识别不足,拒绝分析恶意软件样本
- 记忆和上下文管理不理想,频繁重复说明,影响效率
- 功能期待:自动生成并保持最新的CLAUDE .md文档,异步渐进式压缩,支持视频输入
- 质量波动大,有时表现“迷糊”,甚至比旧版本Sonnet还差
- 期望下一个版本能更快推出,提升智能和稳定性

Opus 4.5 功能强大,用户体验和技术细节仍有不少提升空间。真正的挑战是如何在保持模型强度的同时,提升稳健性和实用性,减少“直觉式”错误,增强上下文理解和持续学习能力。只有这样,才能让AI成为日常工作中真正值得信赖的助手,而非偶尔拖后腿的“聪明伪专家”。


为什么真正的通用人工智能(AGI)不会实现?Tim Dettmers深刻剖析了这个被广泛误解的话题,指出当前关于AGI和超级智能的乐观预期忽视了计算的物理现实和资源限制。| blog

首先,计算是物理的。无论是数字计算还是生物大脑,信息处理都受到物理空间和能量的限制。即使是人类大脑的体积和能量消耗也达到了极限,数字计算面临着类似的瓶颈:算力增长已趋缓,尤其是GPU性能自2018年后几乎没有实质性突破。硬件优化空间有限,任何线性提升都需要指数级资源投入,这意味着简单的“规模化”已经难以继续带来突破。

其次,现有的AI架构如Transformer已经接近物理效率极限。虽然仍有细节改进空间,但这些改进效益递减,远不足以支撑AGI的爆发式进步。与此相对,AI的未来更可能是经济层面的扩散和实际应用的增多,而非某个单一超级智能模型的出现。

再者,AGI若真要实现,必须能完成所有人类能做的任务,包括复杂的物理操作。然而,物理世界的复杂性和数据采集成本极高,机器人在非结构化环境中表现远不及专用工业机器人,且经济效益不足以驱动大规模应用。

超级智能的概念更是基于“智能自我提升”的幻想,忽视了资源消耗和物理限制。即使有更聪明的系统,其持续自我改进也会因资源瓶颈和收益递减而受限,不会带来指数级飞跃。

最后,Dettmers指出,中美两国对待AI的策略截然不同:美国押注超级智能和“赢家通吃”,中国则注重AI在实际生产和生活中的广泛应用和经济效益。后者的路径更实际,也更可能塑造未来。

AGI和超级智能的神话源于对计算物理限制的忽视和思想上的空洞幻想。未来AI的真正价值在于如何实用地扩散和提升生产力,而非追逐虚无缥缈的超级智能。


在写报告或论文时,直接从 ChatGPT、DeepSeek 等 AI 平台复制的公式和表格常常在 Word、WPS 或 Excel 中显示乱码或格式错乱。

PasteMD
是一款专为解决这一痛点设计的效率工具。它常驻于系统托盘,能自动将剪贴板中的 Markdown 内容通过 Pandoc 转换成 DOCX 格式并插入 Word/WPS,智能识别 Markdown 表格并一键粘贴到 Excel,支持处理带公式的 Markdown 和网页富文本,极大提升了复制粘贴的准确度和效率。| #工具

主要功能包括:(演示效果见评论区)

- 全局热键一键粘贴 Markdown 到 Word/WPS,自动转换格式;
- 智能识别 Markdown 表格,自动粘贴到 Excel;
- 兼容主流 AI 网站的 Markdown 和网页内容复制;
- 支持公式转换,减少手动二次编辑;
- 托盘菜单灵活配置,支持通知、热键设置及日志查看;
- 支持 Windows 平台,使用简单,稳定高效。

适合科研工作者、学生和内容创作者使用,极大简化了从 AI 平台或 Markdown 编辑器复制内容到办公软件的流程。



14 last posts shown.