记录时代的洪流下,自我转变、家庭规划的十年。
今天主要处理了两个播客生成项目中封面无法正常显示的问题,同时顺带优化了学习音频播客的生成数量和变更记录方式。第一个项目中,原来的播客 RSS 使用的是外部封面图片。由于该图片地址已经失效,导致播客客户端无法正常显示频道封面和单集封面。本次修改没有动音频生成、转录、AI 摘要、同步、播放器和部署配置,只是把 RSS 里的封面地址统一改成本地音频目录下的封面文件。代码上新增了一个专门生成封面地址的方法,把原来写死的外部图片地址替换为统一方法调用。这样以后如果目录结构或访问路径发生变化,只需要改一个地方。修改后,RSS 中频道普通封面、频道播客封面、单集播客封面都使用同一个本地封面文件,避免继续依赖已经失效的外部资源。修改完成后,重新构建并启动录制容器,确认新容器已经正常运行。同时检查了 RSS 文件、封面文件和容器日志,确保封面地址已经写入 RSS,封面图片也能被客户端正常读取。第二个项目主要面向外语学习音频,用来把本地音频目录生成成可订阅的播客源。今天对它做了几项小调整:一是将每次生成的节目数量从 50 条提高到 80 条,更适合反复听、批量听的学习场景;二是增加了播客封面配置,补齐了标
写在前面昨天和同事聊天,越来越觉得:回望过去,对于自己,现在的结果,也许就是最好的安排。当年面对是否留在北京的选择时,我很坚定地选择了回来。最大的原因是,我需要给自己留出思考的空间和时间,而非是从早到晚的忙碌和忙碌。只有真正沉下心来思考,才能更好地做决策、做规划。除了16-21年的房产“买&卖”外,还进入当时对于自己未知的投资领域。这个选择带来的一个附带结果是:如果当年留在北京,很大概率会走上买房这条路,最终可能掏空过去多年的积累,如今面对北京房产下跌的压力。而今天回头看,手里还能保留一些的资金和选择权,反而成了一种幸运。只是随着年龄增长、资金规模扩大,我越来越意识到:必须建立一种更稳妥、可长期执行的投资方式。不是再追求一年百分之几十的回报率,而是要寻求长期的稳健的投资回报策略,它不是服务于三年五年,而是要贯穿未来几十年,甚至成为退休生活的一部分。至于这套规则到底该如何制定,之前已经有了雏形,也形成了整体思路,还开发了一个程序,投资组合也基本搭建起来。但在具体操作层面,仍然有一些细节没有完全确定。感谢 AI,让我可以和各种顶尖模型反复对话、推演和验证。它们帮助我把原本模糊的想法,一步步
在日常生活中,我们会涉及到多个不同的领域:投资、工作、日记、生活等。随着人工智能助手的发展,像 Hermes 这样的智能助理逐渐成为我们生活的好帮手。然而,随着我对 Hermes 的使用深入,我发现它的能力虽强,但存在一个显著问题——领域之间的混乱。在谈论股票时,常常会穿插我的工作内容;而在记录日常生活时,又会偶尔涉及投资的思考。这种混杂的现象让我开始思考,如何将不同的任务和内容领域进行有效隔离,让 Hermes 更加高效和专业地为我服务。1.核心原则:一个入口,多个隔离角色首先,我决定将 Hermes 设计成一个总入口 + 多个专业分身的结构。具体来说,我将 Hermes 拆分为以下五个模块:总控 Hermes:负责判断当前任务属于哪个领域,并将其交给相应的分身模块。股票助手:专注于股票分析、资产配置、长期持仓等问题。工作助手:涉及稽核系统、客服工作、项目汇报、AI赋能等内容。日记助手:记录个人反思、博客内容、技术折腾等。生活助手:处理家庭、健康、旅行、葡语学习等日常事务。每个领域模块之间必须有严格的界限,防止内容交叉,确保每个模块只专注于自己领域的任务。2.最重要的是做“知识库分区
问题现象podsync 日志中频繁出现两类错误:Bot 验证错误:ERROR: Sign in to confirm you're not a bot. Use --cookies-from-browser or --cookies限流错误:WARN: server responded with a 'Too Many Requests' error原因分析错误类型原因Bot 验证yt-dlp 没有携带登录凭证,YouTube 识别为爬虫Too Many RequestsNAS 出口 IP 请求频率过高被限流,多个容器同时下载加剧了问题解决方案:配置 cookies第一步:导出 cookiesChrome 安装插件 "Get cookies.txt LOCALLY"打开 youtube.com 并确认已登录点击插件图标立即导出 cookies.txt导出后不要再访问 YouTube,避免 cookies 被轮换失效第二步:上传 cookies 到 NAScookies 必须放在容器挂载的数据目录内,否则容器无法访问。先确认容器挂载路径:docker in
让chatgpt按照它对我的理解,帮我绘制我现在的生活状态。提供人物素材后,让其帮我绘制我所理想的退休生活。翻看我的日志找到的2013-11-03 13:09记录的一个关于兰花的故事,让其绘制为一个连环画。测试图片怎么能少了ppt生成效果的测试
这个周末,我终于把脑子里想了很久的一套 AI 能力架构,真正搭起来了。不是那种“装几个工具”的拼装,而是开始有点“系统”的味道了。三个模块,各有分工,也开始有一点协同的感觉。第一块,是个人助理。这一块我基本是沿用了之前折腾的 hermes 智能体。之前在博客里也写过,我是把它部署在群晖 NAS 上,让它长期在线,做信息的收集和处理。相比云端方案,这种“本地常驻”的感觉更像一个真正属于自己的助手——稳定、可控,而且可以慢慢喂数据。接下来我打算把自己过往的日记逐步整理进去,让它真正理解我的行为模式和决策逻辑,而不是只做一个“工具型 AI”。我希望它未来更像一个“长期记忆 + 认知增强”的角色。第二块,是家庭助手。这一块是我自己手搓出来的。从架构到功能,基本都是围绕“语音理解 + 意图识别”来做的。说白了,就是希望它能听懂我说什么,并且知道我要干什么。目前最核心的一件事情,是把它和我的投资体系打通。包括仓位信息、调仓提醒、策略触发这些内容,逐步让它接入。比如:市场有波动,它可以提醒到达某个策略条件,它可以提示甚至执行日常也可以做一些简单的状态汇总这一块其实是整个系统里“最有执行力”的部分。它
今天花了点时间把 LiteLLM 网关的模型分流策略彻底梳理了一遍,记录一下整个思路和最终配置。为什么需要模型分流我的 AI 基础设施是这样的:Telegram → Hermes → LiteLLM 网关 → 各模型LiteLLM 作为统一网关,对外暴露一个 OpenAI 兼容接口,后端接了十几个模型。Hermes 只需要知道 ai.XXX.com 这一个地址,不需要关心底层用的是哪个模型。这样做的好处是:模型随时可以替换、升级、切换,Hermes 完全无感知。模型池构成最终配置了以下模型:付费模型(按量计费,极低成本)DeepSeek V3 — 中文最强,输入 $0.27/百万 token,性价比极高Gemini 3 Flash — Google 最新快速模型,支持多模态,免费额度充足Gemini 3.1 Pro — 强推理,限速时作为 Pro 级备用NVIDIA NIM 免费模型meta/llama-3.3-70b-instruct — 通用英文主力minimaxai/minimax-m2.5 — 中文能力强moonshotai/kimi-k2.5 — 推理能力强z-ai/glm
昨天在vps将Hermes走通,今天使用了一下,总体感觉比openclaw要好,信息比较简洁,配置文件也很清晰。考虑将其作为我的内网的服务,希望逐步将其作为投资平台、家庭日记等核心内容与外部交互的AI能力通道,因此决定将 Hermes 从 VPS 迁移到了群晖 NAS上,顺便把模型路由策略彻底重新设计了一遍。记录一下整个过程,包括踩过的坑。为什么迁移到 NAS迁移到 NAS 之后,Hermes 通过docker仍然限定在我的家庭网络中,但是可以通过逐步的授权逐渐接触我的家庭日志、投资记录等信息,成为对内的AI能力中枢。最终形成,外呼信息抓取以openclaw为主的vps架构,内容信息及投资关联通过内部的docker上的hermes,这样架构更清晰,VPS 上的 Hermes 直接停掉并禁用。部署过程DS218plus 上用 Docker Compose 部署,配置非常简洁:yamlversion: "3.8" services: hermes: image: nousresearch/hermes-agent:latest container_n
openclaw 的热度正在以肉眼可见的速度下降,最近很多人在讨论使用 hermes。今天晚上我也了解了一下这个智能体,别的还好说,最吸引我的就是它的 Token 消耗量:它的 Token 压缩率可以达到一半以上。据说在一些特定场景下甚至能达到 70%。这一点对我非常有吸引力。众所周知,Openclaw 使用中最大的问题就是 Token 消耗量巨大。有个段子说,某公司通过大模型实现了一些功能来替代人工,但实际上在大模型上的投入比雇人还要高。所以,能用最小的代价实现原有的功能,就是它最强大的地方。另外一点是,我觉得它更适合我所需要的场景,Hermes更像一个工作助理,从而能更好地协助我工作。相比之下,Openclaw 比较“重”,它更多地是依靠大量调用外部能力的拓展性。俗话说“成年人不做选择题”,所以今天我也找了一台 VPS,把这个智能体装上体验了一下。目前的感觉是:安装体验:因为我安装 Openclaw 比较早,当时的版本不稳定,过程中遇到的问题很多,安装比较繁琐。相对来说,现在这个智能体就非常简单,支持一键安装。配置与速度:界面化配置非常方便,配上 NVIDIA 的免费模型,再搭一个
写在前面:最近需要一个在葡萄牙语方面比较强的模型。我们在选择一个模型的时候优先选择的是模型的参数,是否参数决定结果?最好是将参数圈定范围内的模型使用真实的应用场景去测试验证,用实际效果来说话。这篇记录的是我用真实考试场景题目做盲测,对比两个候选模型的过程和结论。一开始我倾向于其中一个,但实际测下来结果打了脸。背景:为什么这两个模型?在 12G 显存的预算下,能跑 pt-PT 的本地模型其实不多。经过前期筛选,有两个都能用 ollama pull 一行命令搞定的候选:候选 A: aya-expanse:8bCohere Labs 出品,支持 23 种语言的多语言旗舰模型。背后有完整的论文、公开评测、DPO 偏好训练、模型合并等一整套方法论。Arena-Hard-Auto 多语言评测里在同级别打败了 Gemma 2、Qwen 2.5、Llama 3.1。透明度高、社区口碑好、工业级制作。候选 B: jobautomation/OpenEuroLLM-PortugueseOllama 社区一位用户(jobautomation)基于 Gemma 3 在葡萄牙语语料上微调的个人项目。没有基准测试
walker
万事随性而为,因好而研,因趣而学,从心所欲。脱离依赖,谋划将来,避免经济之险,迈向希望之光。