最近,我对博客图库的存储方式进行了调整,将原本自己开发的Google Drive方式切换到了Chevereto。虽然Google Drive提供了高达2TB的存储空间,但在实际使用过程中却遇到了许多让人头疼的问题,这也促使我开始寻找更适合的解决方案。为什么放弃Google Drive?使用Google Drive作为图库存储的最大优势无疑是其海量空间,但劣势也同样明显:频繁的API授权:由于Google的API接口限制,每隔2-3天就需要重新授权一次,非常不便。长期授权的复杂性:如果想要申请长期授权,就必须提交审核,过程复杂且耗时,使用体验打了很大的折扣。尽管最初为了追求大存储容量,我选择了Google Drive,但长期使用下来,这些问题逐渐显现并累积成困扰。于是,我开始考虑切换到更灵活、可控的方式。Chevereto:更自主的图库方案经过一番调研,我决定采用Chevereto作为新的图库搭建工具。这款开源图库系统不仅功能强大,还能完全由自己掌控。为了实现这一方案,我将其与以下基础设施相结合:Cloudflare Tunnel:借助Cloudflare的免费隧道服务,我无需暴露家庭网
今天,我终于开通了GitHub的Copilot订阅服务。它的价格是10美元/月,我认为这个费用是值得的,因为Copilot能提供强大的代码辅助功能,可以大大提升编程效率。作为一个开发者,我时常需要编写代码,而Copilot能够在代码编写的过程中给出智能的建议和自动补全功能,这对我来说是极大的帮助。通过Copilot的协助,我希望能节省更多的编写时间,把精力集中在更具创造性和思考性的开发任务上。每天抽出一定的时间来进行编码已经成为我的习惯,而现在有了Copilot的帮助,我相信自己的编程效率将会进一步提升。Today, I finally activated my GitHub Copilot subscription. The price is $10, and I believe it’s worth it because Copilot provides powerful code assistance features that greatly enhance coding efficiency. As a developer who frequently writes code
今天早上,我发现ChatGPT悄悄更新了新的o1-preview和o1-mini模型,尽管之前并未抱太大期望,但我的账户还是收到了推送。尽管现在使用额度限制很厉害,一个月使用50次和30次,等找一个重要且复杂的任务,让它跑一下。这个版本在推理方面有了大幅度的提升。
免费服务停掉了:博客图片存储中断的经历最近我的博客网站遇到了一个突发问题,导致我不得不紧急修复。起初,我的网站使用的是学校活动提供的服务器,流量配额相对有限。为了最大化减少流量使用,我选择将所有图片存储在站外服务器上,避免对主服务器的流量产生额外的负担。为了解决站外存储空间的成本问题,我采取了一种较为独特的方案——使用 Cloudflare 加速,并结合 Telegram 作为图片存储空间。通过 GitHub 上的开源工具 Telegraph-Image,我可以轻松地将图片上传到 Telegram 的 Telegraph 服务上,而不需要付出太多额外的成本。为了保证安全,我还参与了这个工具的改进工作,增加了对上传域名的限制,防止滥用上传机制。同时,我也利用 Obsidian,实现了图片的自动上传和博客的快速发帖。这个自动化流程极大提高了我的工作效率,使用体验非常丝滑。几乎每天,我都能顺利地通过这个流程来管理我的博客内容。然而,在周五的晚上,一切都突然中断了。每次我尝试上传图片时,都会出现报错。这个突发问题让我十分焦虑,于是我立刻到相关的讨论群中寻找答案,结果发现很多人和我遇到了同样的问
背景目前nas负责处理音频转为文字,由于没有gpu稍微长一点的音频就需要处理几个小时。将一台装有4060显卡的台式机中的whisper通过api服务的方式提供出来,提供nas调用。封装编写一个FastAPI应用,将Whisper模型包装成API接口,并且能够处理外部传入的音频文件请求。from fastapi import FastAPI, UploadFile, File, HTTPException, Form import whisper import os app = FastAPI() # 加载Whisper模型,这里使用 medium 模型 model = whisper.load_model("medium") @app.post("/transcribe/") async def transcribe_audio( file: UploadFile = File(...), language: str = Form(...), # 接收语言类型参数 initial_prompt: str = For
概述周末在家用电脑上部署了开源的ragflow,选择这个是考虑它支持ocr自动识别,另外还准备安装的是quivr(号称第二大脑),待安装后再做比较。什么是RAG概念:RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索与生成模型的技术,用于提升自然语言处理任务的性能,特别是在问答、内容生成等领域。过程:大语言模型(LLM, Large Language Model):大语言模型是通过大规模数据训练而成的深度神经网络模型,如 GPT-4。它们可以生成自然语言文本,并具备广泛的语言理解能力。检索(Retrieval):在 RAG 中,检索指的是从外部知识库中找到与输入查询相关的信息或文档。这个步骤的目的是弥补大语言模型在生成过程中的知识盲点,尤其是当涉及到事实性问题时。生成(Generation):在获得检索到的相关信息后,模型会基于这些信息生成答案或文本。这一过程利用了大语言模型的强大生成能力,同时避免了仅依赖模型本身知识库的局限性。工作流程:输入查询:用户提供一个查询或问题。检索阶段:系统会从预先构建的知识库中检索与该查询最相关的文本
一个非常标准的计算公式,了解 LLM 和 GPU VRAM 换算规则,下次发新模型就知道本机能不能跑了。
说明本文根据《# A Hands-on Guide to Build Your First Convolutional Neural Network Model》翻译整理。 概述本文将简要讨论 CNN,这是一种专门为图像相关任务设计的神经网络的特殊变体。本文将主要围绕CNN的实施部分进行介绍。我们已尽最大努力使本文具有交互性和简单性。希望你喜欢它。祝您学习愉快!! 介绍卷积神经网络由 Yann LeCun 和 Yoshua Bengio 于 1995 年引入,后来被证明在图像领域显示出卓越的结果。那么,与普通神经网络相比,当应用于图像域时,是什么让它们与众不同呢?我将用一个简单的例子来解释其中一个原因。考虑到您的任务是对手写数字的图像进行分类,下面给出了一些来自训练集的样本。如果你正确地观察,你会发现所有的数字都出现在各自图像的中心。如果测试图像是相似的类型,则使用这些图像训练普通神经网络模型可能会产生良好的结果。但是,如果测试图像如下所示,该怎么办? 在这里,数字 9 出现在图像的一角。如果我们使用一个简单的神经网络模型来对这个图像进行分类,我们的模型可能会突然失败。但是,如果将相
背景今天的项目非常简单,就是将刚刚编写的,将obsidian下whisper目录中的音频文件自动转写为markdown的文本内容。代码编写非常简单,按照官网给出的python样例进行简单改写就可以了。但是在nas上安装whisper却遇到了问题,主要就是root、tmp下的空间不足带来的各种报错。环境安装问题1.创建虚拟环境cd /volume1python3 -m venv whisper_envsource whisper_env/bin/activate2. pip3执行中指定目录mkdir -p /volume1/tmp/pip_cacheXDG_CACHE_HOME=/volume1/tmp/pip_cache TMPDIR=/volume1/tmp pip3 install openai-whisper按照这个方式安装终于成功:程序执行问题在开始进行程序执行的时候再次遇到存储空间不足的问题:应该是程序执行中需要下载whisper模型,但是nas中的空间出现不足。采取将whisper用到的目录连接到比较大的空间中的方式。首先,确保目标目录存在mkdir -p /volume1
内容摘要: podsync Docker 服务由于无法自动更新,导致无法获取最新的资讯。经过排查,发现此问题不是个别问题,而是 Google 的封堵导致的。目前暂时将 podsync 停用,等待后续探索替代方案。问题描述podsync 这个 Docker 服务是我非常喜欢的一个应用,每天早上开车上班的路上,使用该服务听取资讯已经成为习惯,但现在却无法顺利获取最新资讯。排查过程经过重启和 github 上查询相关问题,发现此问题并非个别现象。随后,发现 Google 进行了封堵导致的影响。停用暂时将 podsync 停用,等待后续探索替代方案。持续关注 podsync 的更新: 等待 podsync 团队解决该问题,并恢复服务。
walker
万事随性而为,因好而研,因趣而学,从心所欲。脱离依赖,谋划将来,避免经济之险,迈向希望之光。