今天尝试了一套新的 AI 视频工作流:先用生图工具生成片场环境图,再利用 Veo 3.1 的图片衔接功能(Image-to-Video Bridge)生成两张照片之间的过渡视频。您的浏览器不支持视频播放。坦白说,成片效果在“丝滑度”上还有提升空间。主要原因在于 Veo 3.1 的生成额度实在有限,导致我无法进行反复的微调(Fine-tuning)和抽卡,只能接受这种略带生涩的过渡效果。不过,没有对比就没有伤害。出于好奇,我用同样的提示词(Prompt)在即梦上跑了一遍,结果差点把我送走——即梦生成的视频里,人物的脑袋居然直接来了一个 180 度的大转向!那一瞬间仿佛《驱魔人》附体,深夜看真的吓出一身冷汗。结论: 在理解物理规律和人体结构上,现阶段的 Veo 3.1 确实比即梦更稳健。虽然不仅烧显卡还烧额度,但至少不会把片场变成灵异现场。
由于对 macOS 原生输入法的词库联想能力感到不满意,也不太想忍受某些大厂输入法的臃肿和隐私风险,我一直在寻找那个“完美”的替代品。最近,我终于折腾好了鼠须管(Squirrel)输入法,并给它挂载了目前社区口碑极佳的雾凇拼音(Rime-Ice)方案。经过一段时间的使用,我必须说:这一套组合拳的体验,真的相当不错。为什么要折腾 Rime?Rime(中州韵输入法引擎)在技术圈子里一直是大神级的存在。它的优点非常明显:极致的隐私:完全开源,完全本地化,绝不上传用户数据。极高的上限:高度可定制,想怎么改就怎么改。极快的响应:轻量级,几乎没有延迟。但它的缺点也同样劝退:门槛太高。以前安装 Rime,就像是拿到了一台没有装系统的电脑,你得自己写配置文件(YAML),自己找词库,对于普通用户来说,这简直是噩梦。直到我遇到了雾凇拼音。“雾凇拼音”改变了什么?如果说鼠须管(Rime)是一个性能强悍的游戏引擎,那么雾凇拼音就是一款优化极佳的3A 大作。雾凇拼音是 GitHub 上一个维护得非常勤奋的开源配置方案。作者长期维护词库,不仅涵盖了日常用语,还包含了大量网络热词。它最大的意义在于,它把 Rime
背景很多软件在印度区的价格非常好,所以考虑注册一个印度区的apple ID,最近因为需要使用 Google 的跨区支付,我开始折腾一个印度区的 Apple ID。一开始的想法其实很简单:直接注册一个印度区账号不就行了?但真正操作下来才发现,事情远没有想象中顺利。直接注册印度区 Apple ID,并不“直接”如果直接尝试注册印度区 Apple ID,对网络环境和设备的要求其实相当高。不论是使用浏览器还是在手机上操作,都很容易卡在注册阶段。“此时无法创建你的账户”折腾几次之后,你会发现问题不一定出在“你哪里做错了”,而是注册本身的风控就很严格。换一个思路:先回到国区后来我换了一种更稳妥的方式。不再一上来就硬刚印度区,而是先在完全不使用代理的情况下,注册一个中国国区的 Apple ID。这一步反而非常顺畅:不需要特殊网络环境可以直接使用国内手机号完成验证注册流程几乎不会遇到拦截整个过程下来,体验和早些年注册 Apple ID 基本一致。国区注册完成之后,再做区域切换操作等国区账号注册完成之后,再开启代理环境,登录这个已经创建好的 Apple ID。在动手之前,有几件事情必须提前处理,否则系统
Mole 是一个开源的 macOS 命令行清理工具,主要用于 清理系统垃圾、应用残留和各类缓存文件。它不追求“全自动一键清理”,而是强调 可见、可控、安全,让用户清楚知道系统里有什么、删了什么。项目地址:👉 https://github.com/tw93/MoleMole 能做什么?Mole 的功能非常聚焦,主要包括以下几类:1. 清理应用残留文件在 macOS 上卸载应用后,常常会留下缓存、配置文件和日志。Mole 可以帮你找出这些残留内容,例如:Application SupportCachesPreferencesLogs避免“应用删了,空间却没回来”。2. 清理系统和开发缓存Mole 支持清理多种常见缓存来源,包括:系统缓存Homebrew 缓存Xcode 派生数据常见开发工具缓存对开发者尤其友好,能快速释放大量磁盘空间。3. 查看磁盘占用情况Mole 可以帮助你分析磁盘使用情况,找出 真正占空间的目录和文件,避免盲目清理。如何安装 Mole?方式一:使用 Homebrew(推荐)如果你已经安装了 Homebrew,只需一条命令即可:brew install tw93/tap/
在科技飞速发展的今天,人工智能已经不再是实验室里的概念,而是实实在在走进了我们的日常生活。今天,我在第一时间体验GPT-5的同时也开启了AI定投的投资策略。它能做什么?ChatGPT 的能力非常广泛,不论是工作还是生活,它都能帮上忙:技术助手:能帮我解决编程、网络配置、数据分析等技术问题,甚至协助我写出高质量的代码。语言老师:我在学外语时,它会帮我解析语法、讲解单词、纠正发音,还能生成练习题。创作伙伴:无论是写博客、视频脚本,还是策划一份PPT,它都能快速给出结构清晰、逻辑完整的内容。投资参谋:我在研究ETF或退休规划时,它能帮我查找资料、分析数据、对比方案。生活小帮手:旅行攻略、饮食建议、学习计划、日常问题解答,都可以找它。它的特点如果要用几个词来概括 ChatGPT,我会说是:信息杂食性:几乎什么话题都能聊,从量子物理到咖啡拉花。结构控:总能把复杂的事情分解成条理清晰的结构。细节党:我提供的背景越多,它给出的内容就越贴合我的需求。语气可调节:可以严肃专业,也可以幽默轻松。在我的日常工作与生活中,ChatGPT 已经变成了一个不可或缺的伙伴。从处理繁琐的技术细节,到帮我把零散的想法变
最近我在 NAS 上部署了 Podsync —— 一个可以将 YouTube 频道或 RSS 源转换为播客订阅地址的工具,方便我通过播客客户端订阅和离线收听。不过部署之后我注意到一个问题:它的 Web 服务会将整个目录内容暴露出来。比如我在浏览器中访问 Podsync 的地址时,看到的是类似下面的画面:pgsql复制编辑Index of / - index.xml - feed.json - video001.mp4这意味着只要知道地址,任何人都可以看到、甚至下载我所有同步的文件。对于公开网络来说,这是一个不小的安全隐患。✅ 简单有效的解决方案:设置默认首页 index.html解决办法其实很简单:在 Podsync 的输出目录里添加一个 index.html 文件即可。这个文件会被 Web 服务优先加载,从而替代原本的目录列表。示例文件如下:html复制编辑<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>Podsync 私有服
在日常的财富管理中,清晰地掌握资产的构成与分布是理财的第一步。本次我开发了一个网页应用,旨在提供一个实时动态刷新的资产清单页面,既能直观展示资产总览,又便于用户随时维护和更新资产内容。这个网页是我“100个实用网站和App”项目中的第六个项目,它专注于一个核心目标:资产可视化+实时汇率+灵活编辑。核心功能一览1. 资产总览(支持多种货币币种的计价)系统支持多币种资产的录入,后台自动获取汇率,并将资产统一换算为美元和人民币两种总值,方便用户根据不同需求查看资产规模。2. 资产构成图表展示我们提供了两个维度的可视化图表,便于用户从多个角度了解自己资产的结构:类别维度:比如股票、基金、现金、债券等资产类别。货币维度:根据资产所处币种分类,帮助用户识别汇率风险。3. 资产信息编辑支持资产管理不能只是静态展示,还需要灵活调整。这个页面允许用户对资产进行以下操作:修改现有资产的金额新增资产类别及其金额删除不再持有的资产类别在首页点击“资产编辑”按钮,即可进入编辑界面进行实时调整。4. 实时汇率展示(使用缓存提升响应速度)在资产计算与展示过程中,我们接入了三组重要汇率信息:美元兑人民币汇率欧元兑美元
在寻找适合的语言学习工具时,我们发现现有的很多应用要么是单纯的视频播放器,要么是结构过于复杂、广告泛滥、不适合低龄儿童操作的“学习App”。于是,我决定自己打造一款简洁、高效、专注内容的原生 Android 应用,通过 WebView 加载精选外语儿歌与童话资源,为孩子(也包括我们这些学习外语的大人)提供一个沉浸式、可控、安全的语言学习环境。项目技术背景这款 App 是基于 原生 Android(Native Android)开发 构建的,主要技术栈包括:Kotlin 语言:现代、安全、简洁的 Android 官方推荐语言。Android Jetpack 组件:androidx.appcompat.app.AppCompatActivity:保证老版本系统的兼容性;androidx.swiperefreshlayout.widget.SwipeRefreshLayout:支持网页下拉刷新;android.webkit.WebView:嵌入式网页浏览器,用于展示儿歌/童话等内容页面。为什么选择原生开发?尽管跨平台方案如 Flutter、React Native 近年来风头正劲,但我仍然选
最近,我在“退休前发布100个项目”的计划中完成了第4个项目:搭建一个网络存储服务。这一次,我选择了一台价格非常便宜的服务器,虽然配置不高,只有1T硬盘和1G内存,但它的优势在于存储空间充足。于是我决定:不部署网站,就把它打造成一个对象存储服务。✅ 为什么要做这个?随着项目逐渐增多,我积累了不少图片、音频、视频等资源。这些内容如果全部放在网站服务器上,会越来越难管理,访问也不稳定。而使用独立的对象存储服务可以带来几个好处:资源统一管理:图片、音频、视频集中存放,便于调用和维护。访问稳定:配合 CDN,可以大幅提升文件加载速度。支持外链和权限管理:可以为每个文件生成临时访问链接,既方便又安全。兼容性好:这个系统和 Amazon S3 的接口兼容,以后如果需要升级,也可以无缝迁移。🧰 我用的是什么工具?我选择了一个叫 MinIO 的开源服务。它是一个非常轻量的对象存储系统,界面简洁,功能实用,而且对服务器配置要求不高,非常适合我的这台“老弱机型”。搭配上 Cloudflare 提供的域名和加密访问服务,我实现了一个既安全又易用的网络存储平台。现在,无论是上传文件、查看内容,还是在网站中调用
最近在试用下某单位开发提供的一个系统,拖拽上传文件,自动OCR识别,然后可以继续拖拽一个大模型节点,对识别结果进行智能整理。这让我思考了一个问题:👉 这种通过工具组合完成一项工作的系统,到底算不算是“智能体”?什么是智能体,工作流和智能体到底有啥区别?什么是工作流(Workflow)?先来看个日常例子:公司报销流程:1️⃣ 员工提交发票 2️⃣ 系统检查发票是否合规 3️⃣ 超过一定金额需要经理审批 4️⃣ 审批通过后打款这是一条标准的、预定义好的流程,每一步的处理规则都是提前写死的(比如金额 > 5000 元就需要经理审批)。不会因为发票上写了“特急”二字流程就变了。这就是典型的 工作流系统。 工作流擅长处理确定性流程,比如:审批流数据同步流程订单处理流程什么是智能体(Agent)?来看另一个例子:你问一个智能客服机器人:👉“上周我买的那个蓝色的无线耳机坏了,怎么申请换货?”机器人要做的事情是:1️⃣ 理解你的问题(售后问题?换货请求?) 2️⃣ 从数据库中查找相关政策 3️⃣ 结合你账户信息判断是否符合换货条件 4️⃣ 生成一段符合当前情况的回复,告诉你如何操作
walker
万事随性而为,因好而研,因趣而学,从心所欲。脱离依赖,谋划将来,避免经济之险,迈向希望之光。