鲲的碎碎念
#GitHub #AI ▎screenshot-to-code: 用 AI 快速复刻网页 GitHub | 网页版 此工具基于 GPT-4 Vision 和 DALL-E 3,可以根据网页截图制作“仿冒品”,并且可以选择技术栈。 - 可以根据截图复刻网站; - 可以根据网页链接复刻网站(借助了 ScreenshotOne 的截图能力,需要申请 API Key) - 目前支持 HTML + Tailwind / React + Tailwind / Bootstrap / Ionic + Tailwind…
稍微把玩了一下 screenshot-to-code。
1. 结论
干不了重活,这是肯定的。
对于 Telegram 官网这种比较简洁的布局可以拿捏,不过手机端布局也需要自己调;像 B 站这种上强度的就完全不行了,GPT-4 写复杂任务喜欢省略东西也是老毛病了。复刻 Vivaldi 官网则是搞错了布局。
2. 价格
复刻网页涉及到生成代码(GPT-4 Vision)和模仿网页中的图片(DALL-E),后者比较贵。
复刻 Telegram 官网花费大约 $0.4,包含一次生成和一次改进,其中生成图片的费用占一半多。剩余两个网页图片很少,每次耗费 $0.2 左右。
总之,如果要说 GPT-4 发布会的效果(当时随手画一张草图让 GPT 生成网站),那是合格的;但是目前别抱有太高期待。因为模型的输出长度受限,而且个人认为尚不具备比较复杂的组织能力。
@atashare
1. 结论
干不了重活,这是肯定的。
对于 Telegram 官网这种比较简洁的布局可以拿捏,不过手机端布局也需要自己调;像 B 站这种上强度的就完全不行了,GPT-4 写复杂任务喜欢省略东西也是老毛病了。复刻 Vivaldi 官网则是搞错了布局。
2. 价格
复刻网页涉及到生成代码(GPT-4 Vision)和模仿网页中的图片(DALL-E),后者比较贵。
复刻 Telegram 官网花费大约 $0.4,包含一次生成和一次改进,其中生成图片的费用占一半多。剩余两个网页图片很少,每次耗费 $0.2 左右。
总之,如果要说 GPT-4 发布会的效果(当时随手画一张草图让 GPT 生成网站),那是合格的;但是目前别抱有太高期待。因为模型的输出长度受限,而且个人认为尚不具备比较复杂的组织能力。
@atashare
👍19❤5😁3
#GitHub #终端 #Linux #macOS
▎终端年报 - cmd-wrapped
人们常有总结的习惯,对于常伴程序员的终端也是如此。cmd-wrapped 支持读取 Bash 或 Zsh 的命令执行记录,分析并生成一份“年度报告”。
程序支持 Linux 和 macOS,功能有:
- 按天数显示执行命令的次数,并生成类似 GitHub 的热度图
- 分析一周中最常使用终端的日子
- 分析一天中最常使用终端的时间段
- 分析最常用的程序
- 一些极限值,比如(终端记载的)第一次使用日期、敲命令最多的一天等
- 按年份统计数据
GitHub: https://github.com/YiNNx/cmd-wrapped
@atashare
▎终端年报 - cmd-wrapped
人们常有总结的习惯,对于常伴程序员的终端也是如此。cmd-wrapped 支持读取 Bash 或 Zsh 的命令执行记录,分析并生成一份“年度报告”。
程序支持 Linux 和 macOS,功能有:
- 按天数显示执行命令的次数,并生成类似 GitHub 的热度图
- 分析一周中最常使用终端的日子
- 分析一天中最常使用终端的时间段
- 分析最常用的程序
- 一些极限值,比如(终端记载的)第一次使用日期、敲命令最多的一天等
- 按年份统计数据
GitHub: https://github.com/YiNNx/cmd-wrapped
@atashare
👍13🥰4❤1
#GitHub #记账
▎ Wallos:付费订阅管理工具
Wallos 是一个网页项目,可以记录和统计自己在各种服务上的消费情况。
- 支持中文,支持微信 / 支付宝 / 加密货币 / 银行卡等常见支付方式
- 可以自定义货币列表,并且可以自动将金额转换为一种货币以便统计
- 支持创建多个付款人
- 支持在服务到期前发邮件提醒续费(需自备支持 SMTP 的邮箱)
- 有一个分析页面,可显示每个人每个月在不同领域的花费
- 支持自己上传每个服务的 Logo
- 支持 Docker 部署
- 支持深色模式
GitHub: https://github.com/ellite/Wallos
@atashare
▎ Wallos:付费订阅管理工具
Wallos 是一个网页项目,可以记录和统计自己在各种服务上的消费情况。
- 支持中文,支持微信 / 支付宝 / 加密货币 / 银行卡等常见支付方式
- 可以自定义货币列表,并且可以自动将金额转换为一种货币以便统计
- 支持创建多个付款人
- 支持在服务到期前发邮件提醒续费(需自备支持 SMTP 的邮箱)
- 有一个分析页面,可显示每个人每个月在不同领域的花费
- 支持自己上传每个服务的 Logo
- 支持 Docker 部署
- 支持深色模式
GitHub: https://github.com/ellite/Wallos
@atashare
👍11❤1
热知识:用同一个邮箱帐号注册多个 OpenAI 帐号
在用户名后面加一个“+”号,接上任意内容,例如:
原帐号: [email protected]
这样有效: [email protected]
这样也有效: [email protected]
以此类推。
+ 号后面的内容通常被用作“标签”,实际对应的是同一个收件人。这也是 OpenAI 推荐的注册多帐号的方法,其它互联网服务同理。
@atashare
在用户名后面加一个“+”号,接上任意内容,例如:
原帐号: [email protected]
这样有效: [email protected]
这样也有效: [email protected]
以此类推。
+ 号后面的内容通常被用作“标签”,实际对应的是同一个收件人。这也是 OpenAI 推荐的注册多帐号的方法,其它互联网服务同理。
@atashare
👍24❤3🥴2
#GitHub #Go
▎ gh-proxy-go
GitHub 代码
简单的 GitHub 文件代理工具。修改自 hunshcn/gh-proxy,但是更轻量。要求部署的服务器能访问 GitHub。
Docker(镜像 12 MB 左右):
命令行运行:在 Releases 下载对应平台的二进制文件运行,或者使用 Go 编译后运行。支持
已知问题:不支持原项目的 Git clone 和黑白名单功能。做修改主要是为了节约硬盘空间(原项目 Python Docker 镜像接近 1 GB 是真的接受不能),本人未用到上述功能,因此没有实现(或者说修复) ,欢迎 PR。
@atashare
▎ gh-proxy-go
GitHub 代码
简单的 GitHub 文件代理工具。修改自 hunshcn/gh-proxy,但是更轻量。要求部署的服务器能访问 GitHub。
Docker(镜像 12 MB 左右):
docker run -d -p 80:80 --name gh-proxy-go anotia/gh-proxy-go
命令行运行:在 Releases 下载对应平台的二进制文件运行,或者使用 Go 编译后运行。支持
--port
和 --host
参数。已知问题:不支持原项目的 Git clone 和黑白名单功能。做修改主要是为了节约硬盘空间(原项目 Python Docker 镜像接近 1 GB 是真的接受不能),本人未用到上述功能,因此没有实现
@atashare
👍10🔥1🥰1
#GitHub
▎genact
github.com/svenstaro/genact
当你在应该干活的时候,假装很忙或在等你的电脑!在你的终端上生成各种耗时操作的输出,比如说部署 Docker、编译内核、连接僵尸网络等。可以用于在工位摸鱼,或者拍摄宣传片。
@atashare
▎genact
github.com/svenstaro/genact
当你在应该干活的时候,假装很忙或在等你的电脑!在你的终端上生成各种耗时操作的输出,比如说部署 Docker、编译内核、连接僵尸网络等。可以用于在工位摸鱼,或者拍摄宣传片。
@atashare
😁6👍5👏1🤡1
阿里新开源的大模型 Qwen2-72B 的确有点东西,在我实际遇到的一个编程问题上,遵守提示词的能力和回答质量貌似比 GPT-4 和上一代的超大杯 Qwen1.5-110B 要好😲
Qwen2 回复速度很快。可能受限于知识库,一些写法不是最新的,不过至少核心功能写对了。然后重新生成的内容重复率很高,不知道是因为我用的托管方 (TogetherAI) 有缓存还是啥。
暂时没有和 GPT-4o 对比,因为我没开 API(号封太多了不想搞),在 ChatGPT 测试的话不好覆盖掉默认的系统提示词。可以关注下一些排行榜的数据。我也再体验一段时间。
@atashare
Qwen2 回复速度很快。可能受限于知识库,一些写法不是最新的,不过至少核心功能写对了。然后重新生成的内容重复率很高,不知道是因为我用的托管方 (TogetherAI) 有缓存还是啥。
暂时没有和 GPT-4o 对比,因为我没开 API(号封太多了不想搞),在 ChatGPT 测试的话不好覆盖掉默认的系统提示词。可以关注下一些排行榜的数据。我也再体验一段时间。
@atashare
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍1
#macOS #文件管理
▎ QSpace:强大的多窗格文件管理器
官方网站 | 专业版功能介绍
QSpace 是一款文件管理器,是 macOS 预装应用 Finder(访达)的平替。
Finder 的部分操作方式可能不符合直觉,对于使用过 Windows 的用户来说尤其如此。QSpace 在保留 Finder 相同体验的基础上,提供了丰富的个性化功能,提高文件管理效率。本人使用几个月以来感受很不错,已经替代了访达。
- 支持自定义几十种操作习惯,打造自己的舒适区;
- 支持多窗格管理,移动文件更方便,同时可将窗格保存为工作区;
- 内置压缩引擎;
- 支持自定义右键菜单和“新建文件”预设,并可快速在终端打开文件夹;
- 支持连接阿里云盘、Google Drive、OneDrive、对象存储、WebDAV、FTP 等多种存储服务(付费扩展);
- 强大的批量重命名工具(付费扩展);
- 积极更新,反馈处理及时;
- ...
使用邀请码:
@atashare
▎ QSpace:强大的多窗格文件管理器
官方网站 | 专业版功能介绍
QSpace 是一款文件管理器,是 macOS 预装应用 Finder(访达)的平替。
Finder 的部分操作方式可能不符合直觉,对于使用过 Windows 的用户来说尤其如此。QSpace 在保留 Finder 相同体验的基础上,提供了丰富的个性化功能,提高文件管理效率。本人使用几个月以来感受很不错,已经替代了访达。
- 支持自定义几十种操作习惯,打造自己的舒适区;
- 支持多窗格管理,移动文件更方便,同时可将窗格保存为工作区;
- 内置压缩引擎;
- 支持自定义右键菜单和“新建文件”预设,并可快速在终端打开文件夹;
- 支持连接阿里云盘、Google Drive、OneDrive、对象存储、WebDAV、FTP 等多种存储服务(付费扩展);
- 强大的批量重命名工具(付费扩展);
- 积极更新,反馈处理及时;
- ...
使用邀请码:
JEP9KT
,开通专业版时可享受 10 元优惠🌟@atashare
👍7❤3🥰1
#工具 #网站
▎ 中国大学矢量校徽合集
免费提供大学的校徽矢量图,目标是覆盖教育部公布的全国高等学校 3000 余所,目前已经收集了超过 400 所。
提供 PNG、SVG、CorelDraw 矢量图源文件等资料下载。还会提供学校简介、是否 985/211/双一流、主管单位、视觉形象介绍(学校官网链接)等。
https://www.urongda.com
@atashare
▎ 中国大学矢量校徽合集
免费提供大学的校徽矢量图,目标是覆盖教育部公布的全国高等学校 3000 余所,目前已经收集了超过 400 所。
提供 PNG、SVG、CorelDraw 矢量图源文件等资料下载。还会提供学校简介、是否 985/211/双一流、主管单位、视觉形象介绍(学校官网链接)等。
https://www.urongda.com
@atashare
👍4
#AI #大模型
▎ SiliconFlow
官网
生成式 AI 计算基础设施平台。
提供文/图/视频大模型的托管服务,目前有不少免费模型。付费模型的价格也很有竞争力(以 Qwen2-72B-Instruct 为例,每百万 tokens 的价格为 ¥4.13,相比之下 Together AI 的价格为 $0.9,阿里自己的价格为 ¥5 输入 + ¥10 输出)。
给普通人和开发者提供了有性价比的托管服务,可以快速用上最新最前沿的大模型;其 API 也兼容 OpenAI,可以直接用在现有的项目中。它目前也在和 沉浸式翻译 合作,可以免费用它的模型翻译。
注册可领 ¥14 额度,相当于 Qwen1.5-14B 的 2000 万 tokens。
@atashare
▎ SiliconFlow
官网
生成式 AI 计算基础设施平台。
提供文/图/视频大模型的托管服务,目前有不少免费模型。付费模型的价格也很有竞争力(以 Qwen2-72B-Instruct 为例,每百万 tokens 的价格为 ¥4.13,相比之下 Together AI 的价格为 $0.9,阿里自己的价格为 ¥5 输入 + ¥10 输出)。
给普通人和开发者提供了有性价比的托管服务,可以快速用上最新最前沿的大模型;其 API 也兼容 OpenAI,可以直接用在现有的项目中。它目前也在和 沉浸式翻译 合作,可以免费用它的模型翻译。
注册可领 ¥14 额度,相当于 Qwen1.5-14B 的 2000 万 tokens。
@atashare
❤3👍1
Forwarded from 网盘资源机器人使用指南
🌟AI 资源推荐官测试中!
我们正在开发基于 RAG 和对话的资源搜索功能,目前正在验证可行性。假如效果好,将在未来集成进 @AliYunPanBot 和同系列机器人中!
测试形式:通过内部网页链接来体验搜索效果,并提供反馈和建议。网页版目前只用于测试,最终形态暂定为和机器人直接对话。
测试者要求:对 AI 感兴趣,愿意持续测试并提供有效的反馈;有大模型的开发/使用经验者更佳。
内测群链接:这里,第一批限 100 人;@AliYunPanBot 的 VIP 用户也可以直接申请参与测试,可以给机器人发送
我们正在开发基于 RAG 和对话的资源搜索功能,目前正在验证可行性。假如效果好,将在未来集成进 @AliYunPanBot 和同系列机器人中!
测试形式:通过内部网页链接来体验搜索效果,并提供反馈和建议。网页版目前只用于测试,最终形态暂定为和机器人直接对话。
测试者要求:对 AI 感兴趣,愿意持续测试并提供有效的反馈;有大模型的开发/使用经验者更佳。
内测群链接:这里,第一批限 100 人;@AliYunPanBot 的 VIP 用户也可以直接申请参与测试,可以给机器人发送
/me
命令,将它回复的内容(包含会员有效期)转发给 @anotiaw 来获取资格。❤2
最近 DeepSeek 俨然填满了我身边的大部分科技类信源,在狂欢之后(之中?),想综合最近看到的信息以及实际使用体验,总结我的一些想法,可能不成熟。
@atashare
1. 首先,DeepSeek 在国内外产生巨大反响,我觉得主要是它暂时打破了国外头部厂商在这几年有意无意培养的一个认知:搞 AI 会越来越烧钱。
以 GPT 系列为例,从传统的文生文模型 GPT 3.5,到多模态模型 GPT 4(o),再到现在的思维链模型 o1 和实时语音模型 GPT 4o Realtime,API 的价格目前遵循着“推出新品(贵) -> 优化性能或者推出小模型(降价) -> 推出新品(贵)”的周期。而网页版的 ChatGPT 会员价格从 Plus ($20) 涨到 Pro ($200) 甚至传言的 $2000,Sam Altman 还频频表示 OpenAI 一直在亏损,都传递出“大模型越来越烧钱”的信息。
于是 DeepSeek V3 和 R1 发布后,美国研究员们发现 DeepSeek 居然只用 GPT-4o 的 1/10 或者更低的成本,就做出了在一些方面追平甚至超越 4o 和 o1 的模型,560 万美元的成本比 Meta 一些高管的工资还低。人们自然而然地产生了问题:为什么我们之前要花那么多钱?怎么和投资人交代?所以微软等机构开始质疑,试图找 DeepSeek 的漏洞。同时,很多机构也在复现和部署(例如微软 Azure 云就搞了推理服务),尝试趁着 DeepSeek 官方服务超载的时候分一杯羹。
但长期来看,AI 烧钱的主旋律还会继续。一方面,DeepSeek 是在国内被制裁的环境下,用有限的硬件一点点抠出来的性能(比如说,他们用英伟达的 PTX 语言做了很底层的优化);另一方面,探索新技术也很费资源,如果手里的资源不够,甚至连技术的验证和迭代都跑不快。DeepSeek 主要证明了现有硬件性能还有挖掘空间,并且不但 N 卡可以流畅地部署大模型,A 卡和华为昇腾等国产显卡也能(前者 DeepSeek V3 已经首发支持,后者硅基流动已经和华为云合作实现)。“低成本高效率“和“高成本高效果”这两条路本质也不冲突。
> 这里补充一下,国外推出的不少推理服务主打的其实是隐私与合规性。因为 DeepSeek 官方是会用对话记录改进模型的,并且作为一个 🇨🇳 产品,很多老外天然排斥。如果把模型部署在海外,然后再特意备注“我们不收集对话记录”,不就成为卖点了?
> 另一方面,微软一边质疑一边火速推出服务,也能看出微软作为巨型企业,不同部门有不同的行为逻辑,政治和商业行为不冲突。
2. DeepSeek 的局限性。咱程序员当然不能像自媒体那么沸腾。DeepSeek V3 和 R1 当然也有缺陷:
- 它俩是专攻文生文方向,是将有限的资源集中到了一个点上。这两个模型都不支持多模态,官网虽然支持图片输入,但本质上使用了 OCR。不过反过来说,“专心做好一件事”也有可能是它出圈的一个因素。
- 目前在工程化产品中的帮助有限。像豆包、通义千问这些产品直接从用户接收输入,大模型直接输出给用户,没有固定的限制;而在其它一些产品里(比如说面向程序员的编程工具),大模型只是产品功能的一个环节,需要稳定、格式化的输入输出。V3 和 R1 目前对 tool call 的支持都不算好,在编程这个垂直领域里,prompt 的遵循能力和效果比不上 Claude 3.5 Sonnet 等广受好评的模型。
- 最近的一个观点“在 R1 上可以抛弃 prompt 工程”,并不认同。在简单问题上确实可以简单提问,让 R1 自己推理完善计划;但复杂场景里这么干可能让它填充的细节变得脱离实际。更何况,即使给了充足的指示,它的效果有时候也一般(可能是特定场景的训练数据不足)。
> 评论区的图片对比了 DeepSeek V3(左)和 Claude 3.5 Sonnet(右)在 AI 代码编辑器中的表现。R1 的表现和 V3 类似。
3. 宏观总结一下 V3 和 R1 的意义
- 在现有的技术大框架下,提供了一种高效率的新思路,并且透明开放。
- 在大模型领域培养了好的人才
- 给全国人民拜了个好年
- 让 AI 进一步靠近了普通人,强化了“中国的 AI 原来也这么好用,我们的模型有能力走向全球并被广泛认可”的认知。在现在这个节骨眼上,某种程度上来说,它的存在本身已经能成为历史的一个里程碑。
> 硅基流动 CEO——“这个想法有没有问题:这可能是一个历史事件,参与就是赢,赚不赚钱已经不重要了”
@atashare
👍9❤2