Jelech

ROME论文解读:借ROCK与ROLL构建Agent由来的笔记

最近阿里巴巴新出了一篇论文:《Let It Flow: Agentic Crafting on Rock and Roll》 我研读了几天,字里行间看到的都是我的新框架的东西,想一想自己还在做设计和开发,别人都已经发论文了,心里略感悲凉。本文做一些阅读笔记和总结。 前言 这篇论文提出了一个名为 ALE (Agentic Learning Ecosystem) 的全栈生态系统。最有意...

强化学习训练加速: 多种编译器/语言对性能的影响

摘要: 本报告旨在评估不同编程语言及编译优化技术在不同复杂度(简单逻辑 vs 复杂交互)RL 环境下的性能差异。测试涵盖了从小规模标量计算到大规模矩阵运算的典型场景。 源码 1. 环境定义 仅测试使用不同语言或架构实现相同的环境的性能差异, 不测试不同算法的性能差异. 1.1 Hello World: CartPole 特征: 极简物理逻辑,仅涉及少量标量...

算力贫民窟下的AI研究机会

最近在看博客时候, 偶然发现了一个提问: 《无大算力时,作为学生,LLM 还有哪些值得做的研究?》 突发有感, 对于工作中的个人, 如果想技术提高, 又没有直接大量的资源可以使用, 那么作为工程来说, 还能学习和研究什么东西呢? 因此, 我读完全篇, 整理了一份知识图谱, 方便自己也方便大家后续在其中探索奥秘 %%{ init: { "theme": "forest", ...