2025 年 3 月记事板
4 日
呀,这近两周都没写,因为确实有点忙,虽然不知道在忙什么,最近才开始写作业(开学前两周不写作业已成常态……),但是就是没啥时间。
哎呀,但是今天怎么着都得来写一下,不管是出于什么原因啊。
啧啧啧,怎么说呢,呵呵呵,哈哈哈哈哈哈。四个月前的 TRY 终于算是尘埃落定了?S 兄,你知道的,我一直是你的忠实粉丝啊,我从来没有在四个月前对你不敬呐,即使是前几天我也是相信着你的(只有一点点怀疑)。
嘿嘿嘿,然后今早还领了下国奖的证书:
不过这个证书有点太大了,我所有的文件袋都装不下,现在也只好先放储物柜里,到时候放行李箱带回家。
国家级的荣誉呀。想我在此之前获得的最高荣誉大概也只是校级,这中间跨越了多少个层级啊,难以言表。
当然,我是不希望这个荣誉真的就是我获得的最高级别的荣誉了。我自卑且自负,既惴惴不安认为这有点像天花板,笼罩住了我的视界,又渴望将其作为一个垫脚石,踏上更高的阶梯,直冲云霄。希望在我 20 岁的时候能有更深的思考,并尝试以文字记录下来。
然后按时间顺序大概就是 5K+?当然这个比起两个倒是微不足道:
但是随着一个平平无奇的人的消息在我眼前出现,这个似乎也与之交相辉映,就像中间那条龙那一瞥。
再然后就是哼哼了。看了看时间,正点是我在正点,这也太……然后紧接着看了个 UP 的更新,接着大的就来了。
哇哇哇,写完上面的去写了私博后,发现博客总字数居然破 1M 了,前几天还想着二月最后关头只要稍微写一点(何况有成批素材)就能破了,当时最后看只差 5k 了。不过不好说是不是今天破的,虽然大概率是,因为这期间的笔记应该到不了 5k 份额。只是不确定是早上记笔记时到了,还是刚刚到了的。
今天,最开心了。
5 日
小悲剧,checkout 了一下发现应该是 2.28 的《自然语言处理》笔记第二节「自然语言处理基础」时达到了 1M 总字数。要是我不 checkout 的话就是为昨天锦上添花了,不过昨天的喜讯不需要其他的来分走荣光。
今天时间也不多——唉唉,怎么有人开学第三周了还没讲完半年前的事情啊——随便讲点。
嗯,好像没什么短的可以说一样?这下有点尴尬了。
冷笑话
那不如来讲个去年年底想到的冷笑话。
gcc
是什么?
解答
gcc
是注释。
笑点解析:在 Vim 的 vim-commentary 插件中,gcc
可以用来注释当前行,如插件说明所述:
Use
gcc
to comment out a line (takes a count)…
怎么样,有没有给冷到?
Vim 换行
这个是年底(12.31)记录的,当时在找有关 Vim 换行替换的信息,找到了这么一个问题 How to replace a character by a newline in Vim。
可能会疑惑,\n
不就行了吗?恰恰就是因为 \n
不行我才会去找这个问题的。另外这个需求,当时我不会是在那个吧?但是这个日期,真的有吗?我去看一看 Git 记录,马上回来,绝对能写完这部分。
啧,没找到,最接近的也是 12.29。那应该不是喽?不过还有啥地方会遇到啊,好奇。
答案就是用 \r
,即使想要插入的是 \n
。但是搜索的时候还是得用 \n
。这是因为在搜索的时候,\n
就是 LF,\r
就是 CR;但是在替换的时候 \r
就是新行(new line),\n
就是空字节(0x00
)。嗯,我沉思……
DEC
寒假初期 DEC 挂了,一登上去会立马下线,说过期。查了一点资料,为容器加了 DNS 设置解决了,原因不明。
以旧换新
一月初的时候看到了「以旧换新」的活动,当时顿时有点心动。不过搜罗一番资料后逐渐冷静下来了。
我最为重要的两个电子设备就是笔记本和手机了。笔记本虽然内存是有点不够用,但其他方面可以说是「完美无缺」了,没有任何问题。手机倒是时间有点长了,但是日常使用也是没有大碍。于是最终还是否定了这个念头。
当然还有原因就是如果要换的话可能要跟人交流什么的,比较麻烦,放弃了。此外还有就是对电子设备一窍不通的我可能还得去调研一下,而选择太多了,我望而却步。
既然这两个电子设备都很重要,那谁更重要一点呢,能夺得我的芳心(吐了)?
我很想将「笔记本」脱口而出,但其实发现根本不行。
要没手机,我连宿舍都出不了(不过现在不会了,我录入人脸了)。即使翻过闸机,我也是不能购物、吃饭、出行等等,宛如一个废人。所以从日常生活角度来说无疑是手机更重要。
但是「生活」在我生活中的比重并不多,大多数时候,譬如现在,面前同时放着笔记本和手机,我大部分时候都会毫不犹豫地将手机扫到一旁,跟笔记本卿卿我我。
所以说,「重要性」这个说法,并不够明确,我也无法给出确定的答案。但要说我更偏爱那个,答案自然是显而易见的。
7 日
奇怪,明明留了一个晚上来写,为什么又只剩一个小时了呢?
今天不打算弄子标题了,只聊一件事情,也是我酝酿了很久的想法,那就是 AI。不过因为之前提过的原因,都没有记录下来灵感,所以真的就是想到哪写到哪。正好明天中午 DS 赠送的十块钱过期,而我还剩四块钱。
AI 无疑是革命性的。我不说什么第几次工业革命之类的话,我只说我的生活体验。回望我不到 20 年的人生,我找不到第二项科学技术,能够这样彻彻底底地颠覆了我的生活方式。
有很多工具,例如 Vim 属于是用了后就脱离不了的,也算极大的改变了我的生活,但这远远称不上是「颠覆性」的。但是我却可以毫不犹豫地说,AI 确实是颠覆性的。
这个话现在讲是不是有点迟了?2022 年底 ChatGPT 3.5 出来的时候就已经引发过激烈的讨论了,所谓的「工业革命」的说法我也是首次在那里看到。甚至啊甚至,那会不甘落后的我还掏了钱买了个手机号,2.1 刀啊。下面是当时的摆记:
第二主题是 ChatGPT。……,试了一堆免费虚拟手机全部失败,最后氪了 2.1 美元(坐地起价,几个月前还是不设下限,且 0.2 美元就能搞,现在是 2 美元起步,多的 0.1 是佣金还是多按的我也忘了[应该是佣金],还用了其中一半买)搞了个手机号,终于注册了个号,结果用不了…心态爆炸。且微软封锁了之前的方法,现在 New Bing 要翻了(翻了后也用不了,提示到限额),……
但是,虽然从建博开始我一直敬称 Copilot 为大爹,但说实在的,并没有非常强烈的「大变局」的感触。
这个感触是今年才有的,没错,就是因为 DeepSeek。
在此之前我其实完全没关注过 API,价格更是根本没去了解过。只是凭借不知道哪里来的「感觉」,认为这是奢侈品,对于我这个抠门到极致的人来说,完全是沾不上边的。
DS 的出现打破了我的认知,原来大模型的价格已经低到一定地步了,低到了我感觉完全可以接受,甚至想会不会有点太低了[1]。不仅如此,这是我第一次感受到 AI 的颠覆性。
何解?回想之前 ChatGPT, Claude 之流,虽然在周围的圈子都是耳熟能详。但是再放眼更大的世界,你跟他们讲「大语言模型」什么的,他们反而可能会一头雾水。
我在自己的信息茧房,我并不了解小世界之外的群体,DS 算是打破了小世界的壁垒,让很多人第一次接触到了大语言模型。
即便之前也有各种国产的 AI,如某某一言啊,某包啊什么的,也有做的比较好的 Qwen 等,但都没有 DS 这样的破圈效应。我没有数据,只有感觉,我的感觉就是 DS 可能是大多数国人接触的第一个大语言模型。
为什么会这样想呢?我前面刚讲过我在自己的世界中,不会主动走出去,但我与外界还是有联系的——我的父母。在寒假,我很惊讶地发现了我的爸爸在用 DS,看到这一幕的瞬间我就想到了上面的内容,同时第一次感受到了 AI 的颠覆性。
这种颠覆性并不仅仅是对一个人生活方式的颠覆,还是对整个群体的颠覆。在前面这部分我还只会这样讲大白话,得等后面写细节一点。
我感觉到,在这个新时代下,知识不再是奢侈品,而是真正让所有人都触手可及的必需品。
对于一些人来说,AI 可能是他们人生中第二个感受到颠覆性的技术,第一个可能是互联网。我则是一出生就在互联网的世界了,所以感受不到这种颠覆。互联网跟我所说的 AI 的颠覆性是类似的,就是知识的获取难度变低了。而 AI 的颠覆性就在于,突破了互联网的界限,你不必苦苦在互联网的大海中寻觅着资料、不必在各个互联网围墙中探索发现。
在之前我想要学习新知识的话,自然就是 Google 走起,看资料。但有时候一些东西真的就是一拍脑门就想出来了的,根本不想大费周章去查资料,然后得到古板的文字,只能生啃。因此会放弃了很多探索学习的机会。
而现在不一样了。这一周,为了尽情挥霍 DS 赠送的金额,我都没咋听课了,想到啥就直接问 DS。不说学没学到知识,我眼界开阔了不少:我能在看到关税讨论的时候直接把疑问发给 AI,理解他们的论点以及根据;我能无意间看到之前生硬拼凑的 VimScript 时让 AI 解读,理解我当时不能理解的;我能在想到一个有关数据偏见的问题陷入迷茫时直接问 AI 让它为我解惑;也能在对概率的概念理解模糊不清时请它替我指点迷津;甚至可以由此引申到量子力学让我初窥大门……
例子太多了,这只是其中很小、也是很早的一部分。很多都真的只是灵光一闪,想到了,也就问了。要放在之前,那确实就是随之消散了。
那么,为什么会是 DS 呢?在 DS 出来之前,除了 Copilot 外,我用 AI 的频率还是相当之低的。至少不会有什么灵感就随便敲一手问一问。
我想,应该是「能力」与「价格」。在此之前即便 OpenAI 如何如何,我都还是把它当第一梯队的,不过实际体验(免费)不尽人意,所以说倒也没太在意。加上那个价格嘛,嗯。我想 DS 带来的就是让足够智慧的 AI 能走进千家万户,这是它对于普罗大众最为重要的意义。
然后它还开源……种种优点都在他们的身上展现了,我还能有什么好说的呢。
我也提到过了,期末那会看到 DS 的新闻就用了用,是让我有点吃惊的,感觉能力还不错(记得当时有一个「深度思考」按钮,但没有 R1,然后当时思考内容有时候还会有英文),于是直接弃用了 ChatGPT。我那时也没想到,能到现在还在为其唱赞歌。
当然,DS 千好万好就一点不好,那就是服务不好,怀念年初那会的高速反应呐。
现在除了 DS,用 Qwen 与 Gemini 比较多,ChatGPT 已经基本不咋用了。
既然是随便聊,就提点别的,就说 Gemini 吧。
我前面提到过 Gemini 很快,目前看到没有一个大语言模型能跟上它的节奏,官网上的对话显示很优雅。不过 API 就有个缺陷了,太快了。
快还不好吗?好,非常好。但是用客户端的话显示效果就是这样的:显示一大片文字,然后顿一下,再显示一大片文字,有非常明显的卡顿感。而那些慢一点的,每一次吐的也不多,就真的像是在打字一样,这样反而没感觉到卡顿。明明是前者更快,但却是后者的体验更好。所以才说 Gemini 官网那种显示效果做的是真好。
前阵子 o3 出了(是 o3 吧?不太确定,反正就是有个类似 DS 的「深度思考」),我试了一试,感觉它那个思维链有了跟没有一样。我第一眼被 DS 震惊的原因之一就是我感觉它的思考过程很有意思,我感觉到似乎真的像是在窥探一个人的思考路径。但 o3 完全没给我这种感觉。实际体验也挺一般。
不过有一件事情必须要为 o3 正名一下的。o3 实力还是有的,虽然我测试了一些感觉不太行,但是当我拿一段加密文本用于测试时,o3 解出来了,DS 没有。具体过程大概是这样的,发第一句,条件太少自然解不出来,然后重复几遍,观察它的思考过程,仍然解不出来,最后卖了个很容易据此破解的破绽就解出来了,后面发啥都能解密(不过不肯透露怎么想的,明明我只是想让它解释一下怎么加密的,它不肯透露它的思想,绷不住了)。但是 DS 没有解出来,这让我有点小惊讶。然后 Qwen 当时也试过,不过不是推理模型也不太能相提并论,反正就是不肯想,一直问我别的。
说了这么多,其实目前这个阶段 AI 在我这的定位是「搜索引擎」。
一个人对大部分事物都是不了解的,也许只有在少许领域有所深入。即便是某个领域,也可能只是几个点,周围也便只是一知半解。
AI 做的就是扩充广度。从前在陌生领域进行学习可能是一件非常痛苦的事情,不是因为你不知道怎么做,是你甚至不知道要做什么。如同把人丢到一个迷雾森林中,任谁也不敢轻而易举地移动步伐。而 AI 则是手电筒,照亮了周围的事物,给了你一个追问的契机。有了开头,那后面的事情就好说了。
似乎还有很多没讲的?不过今天就先告一段落吧。
11 日
落凤坡
故天将降大任于吾身也,必先替其清障,免其劳碌,足其口腹,顺其心意,铺坦途以畅其行。遂使我无所事事,安然摆烂于衽席之上。
医院
今天开始~我要自己去医院……
没错,今天去了一趟医院,苏州科技城医院,也就是南京大学医学院附属苏州医院。比文体中心还近不少,骑车只要二十分钟出头就能到了。
起因大概是颈部一直很难受,然后一天睡觉时怎么调整姿势都不舒服,加上之前原本计划去一趟医院嘛也没能实现。虽然说当时打算去看的是手,不过经过一段时间左手持标后,很少出现之前那般剧痛了,无力与偶尔的疼痛倒还是有,但不足以让我心慌慌了。此外我也有猜测会不会颈椎的问题,因此「去看一看吧」这个念头就出来了,周末预约了一下。
支付宝还是什么手机的平台预约,全部显示满号,我无语。然后去官网预约,可以。选的就是周二下午,跟看电影一个时间点,也是想着工作日人会少一点。
下面就大致讲一下流程吧,我也算是会自己看病了。
我对看病确实是一窍不通,上次在鼓楼医院也是稀里糊涂的,感觉这次不能再这样无头苍蝇了,于是我求助了 AI:
不过情绪价值大于实际价值吧。
一开始带书包只是为了装水壶,还想过要不要不带水壶轻装上阵。不过后面看来带书包真的是正确无比的决定。
门口的共享单车还是只有几辆,我不知道前面讲过没,留下来的质量都不咋地,有的还会有小广告。呃呃,卖也不找个好点的。
嗯,开学不到四周我就骑车出门两趟了,比上学期好。然后不考虑低质量的单车,骑车还是挺爽的,风景也好,环境舒适,而且今天气温也挺不错。
到了后还有过安检,有点稀奇,好像是我第一次见?是不是因为医患纠纷什么的?
然后进去后直接去自助的机子,点了个好像是医保码的选项?然后支付宝医保码刷,我去年在鼓楼医院就是这样弄的,结果报错,也只显示出来个错误代码,我也不知道哪错了。只能再试,再试还是不行。
这时候就有护士过来帮我看了,真好。我之前好像在哪里看到说是要求「主动上前」的?确实,要是没她的帮助,我肯定还要自己多试几次,然后驻在那里研究发愣一下。
她看了一眼上面的「鼓楼区」,然后说异地什么什么的。这个医保我是真搞不明白,除了医保外生活的东西,比如什么手机号、流量、宽带什么的也完全在我的知识范围外。然后我后面看了一下,这啥异地备案我弄过的,只是弄完后说什么必须异省,我无语。话说医保这东西不能全国统一吗,好麻烦呀。
然后我说没有,她就说那就只能身份证刷了。我用身份证刷了,果然可以,喜。不过很快就喜不出来了。
然后就是交挂号费,比鼓楼那边贵个 4 元,12 元。然后打印出来一张单,上面写了候诊大厅的位置,找过去。
然后到了大厅,我还在外面研究游荡的时候,柜台的护士就提醒来签到了。嗯,太好了,引导做得真好,感激。把单子上面的码扫一下就算签到了,就在那里正式等着了。
即使是工作日,人还是有一些的,看病不像娱乐,是不分时间的呀。
然后就进去了,讲了一下症状,然后医生告诉我下去拍个片,过程可能就一分钟?中途甚至还稍微聊了一下别的,医生问我是不是学生,在哪念书,然后又问我认不认识一个人(不认识)。
出来后我一看那个拍片单,我嘞个去啊,100+ 元,这么贵的吗,心在滴血。
然后回到自助机器,缴费,取单。然后去影像科服务台,然后就有了房号,步骤类似。
然后拍片,卸下一些东西,外套、眼睛也脱掉,按医生的指示调整姿势,正、侧拍了两张 CT。
然后成片要一定时间,这时候就能再回去,重新签到排队。
再进去,医生指着片跟我讲颈椎没问题,看来是肌肉的问题。好消息,颈椎没问题,坏消息,白拍片了,虽然说不拍片也不知道颈椎的问题。当然,要是年纪轻轻颈椎就有问题了,我就重开吧我就。
然后开了个药。出来再一看,2 盒 8 片 96 元。我嘞个啊,这药是金子做的?去年鼓楼医院也开了几个贴片,比这个还多不少,就十八块。
前前后后加起来花了两百多,再加点我都能买个 C–C++ 了,悲。
我缴费的时候就看到下面写了,用身份证代表完全自费,哭。不知道后面能不能报销,即使能的话,这个参保地不一致、各种操作,想必也是相当困难的,唉。我回去后又找了一下,也没看明白苏州校区的学生该怎么弄这个医保。
后面去影像科等成片,上面说大概要两个小时?于是我在外面等,不敢看手机了,开个朗读听点东西。
听了没多久,我看袋子上的时间,直接就是近六点半,我弄完前面的在那里等都已经四点二十多了,呃。于是决定订个外卖,来苏州这边还没吃过外卖。
然后挑挑拣拣,还有各种调整地址什么的,已经完成所有的设置了,在订单界面了,就差交钱了,我往上一瞥发现好像不对。本来那个显示排队信息的屏幕第一行说的大概是等待到名字出现?然后现在变成了可去自助机器打印。
我也不清楚是一开始就能自助打印、我在那里傻坐了一会,还是到那时候才可以。不过早早打印完溜走了,差不多五点骑车回去。那外卖自然是告吹了,挺好。
回去的时候,导航给的路线方向和来时相反,走了条新路。
下面的就跟医院没啥关联了。
回来路上边骑车边感慨环境真好,苏州校区于我而言简直是个天堂。迎着落日骑行,别有一番风味。
快到学校时想到,这个骑车前一小时免费,上次我还把车开进学校了,那不如以此为契机参观一下从未踏足的西区?
于是就这么做了。不过西区还仍然在施工,连通部分包裹西区的那一条路,就是我唯一能通行的。但看着建成度已经差不多了,基本每个建筑都大差不差了,不知道什么时候会完工。
我起码在这里呆三年,第一年已经快完成了。希望可以多呆几年吧。
回去途中停了下车,走到了一个叫「院士林」的地方,走近一看才发现有的上面还真的挂着院士的名牌,算是名副其实了。不过不知道是不是我的问题,我感觉这个林子看起来有点诡异,像啥就不说了。
不知道去年九月的我是怎么撑下来的,刚开始的时候居然可以一周跑四次,明明昨天也没跑,今早跑的时候腿好痛,后面还骑车,又累又痛。所以我早早就撑不住了,一周三次,第三次周末两天选一天。
而今天骑完车后感觉,即使周末有一天不跑步,骑车散散步也是挺好的。
14 日
今天是 日,还是白色情人节,第一次发现这两个日子居然是同一天,啧啧。
开学也快一个月了,我前面的事情还没讲完呢,真的是太摆了。
近段时间以来有了很多灵感,很多之前积压的东西,现在都想「大展身手」一下了。但是横亘在我面前的还有拖了又拖的一个又一个作业与任务,此外还有就是记录也渐渐有点荒废了。唉,每一次有了灵感想做点事情时,总不会是处于一个无后顾之忧的时段。
反正又是墨迹了一小会,能写的也不多了,就写个翻译的事情吧。
之前用沉浸式翻译用的就是 Google 翻译的,这个我 OCRC 也是用的网上扒拉到的一个 Google 翻译 API,刚刚试了一下居然还能用。
后面渐渐有点不满了,英文效果还凑活,但是其他语言,例如日语、俄语等,那真的就是一窍不通了。有时候甚至不如机翻成英文再翻译成中文准确(X 上可以翻译成英文,然后再靠沉浸式翻译译成中文,都是 Google 翻译)。
不过后面我偶然看到(出处不详,也可能是我臆测的),好像说 Google 的 API 可能比较长时间没有维护,质量不高,例如我看别人的 X 的 Google 翻译直接译成中文跟我译的并不一样。
于是萌生了更换的想法,弄了点机翻的 API。在这个 AI 时代还用传统的机翻似乎是比较难以理解的,不过我主要是从价格的层面考虑。
虽然大模型降价不少,但我还是吝啬地不肯掏出点钱提升一下翻译质量。而各厂商提供的 AI 免费额度大多也就是五十万,再高也没高到哪里去,这个在高峰时期只够用一天的,还不够塞牙缝。
而机翻大多都能提供百万的字符数量,虽然还是不够,但是每月重置,加上东拼西凑点,还是够了的。当然真正的杀手锏实际上是腾讯翻译官,给了五百万额度。
因此将其作为了翻译主力,Azure 作为了辅助(百万额度,比腾讯效果好一点)。日语效果确实好了一点,英语似乎也还行?
同时还能借此看一看我的用量如何,为后面可能的计费铺垫。按近 30 天的数据,平均每天要用 24w,最高一天用了 53w。可以说其实五百万,再算上 Azure 依旧是不够用。不过因为不是从月初开始弄的,所以上个月算是平稳度过了。
但用了一阵子就发现了,腾讯质量其实挺差的,甚至比 Google 还差,只是日语翻译通顺了点骗过了我。下面是一些绷不住的:
嗯,卸载。
好的,删除。
苦差事,这个翻译第一次看绷不住了,但后面细想好像还行?
还有就是它是能把缩写翻译错的……例如 MCP 译成 HCP 等等,这是怎么做到的?简直离谱。
剩下的后面讲吧。
17 日
好的,我又回来了。先接着继续讲。
翻译(续)
然后我就决定改用 AI 翻译了。之前为什么不直接用 AI 翻译呢?要知道 Transformer 最开始似乎就是为翻译而诞生的。很早之前确实想过用 DS 之类的高性价比模型做翻译,但还是没能下决心,就是速度不够快。何况那会还正好网络攻击,响应很迟钝。于是就搁置了。
我沉浸式翻译主要看的就是三点,准确性、速度与价钱了。准确性 AI 足以,模型性能之间的差异基本属于可以接受的范畴。所以就是价钱与速度了。
然后 14 号那会,下午的时候折腾了一下,在火山方舟那里整了一个 Doubao-1.5-lite-32k,速度非常快,感觉甚至比腾讯机翻还快。此外我还看了看并发限制也很高,把现有值翻个十倍都不到限额(所以我翻了五倍,现在是每秒最多 50 次请求),简直就是天生为这种翻译服务而生的。
更何况最近还有个所谓的「协作奖励计划」,实际上就是数据换额度嘛,我懂我懂。放心给你数据,反正我只用来翻译。可以有每天至多 50w token,按之前的用量来说可以说是绰绰有余的。不过实际上奖励是这样给的:它每天采集 50w token,但不是每天都给你 50w token,每天给的资源包数量是昨天用的数量。但是因为赠送的资源包过期时间是一个月后,也就是说一天后不会作废,所以说其实还是相当慷慨的。
因为这个活动,我就不用 lite 了,直接上 pro,反正都是送的。当然,如果是要自己付钱的话那还是 lite 比较合适,一个月大概不到十元。
用了这几天,其实跟我预估有点出入。之前是平均每天不到 30w 字符,最高也就 50w 出头,但我现在就用了三天,3.14 那天甚至还是快晚上才开始用的,就用掉了 54w token,直接破掉了记录。然后 3.15 用了 76w token,3.16 用了 47w token。日均其实超过了 50w,远胜机翻那会。猜测是重复的 prompt 的缘故。
另外 AI 翻译确实质量高上一点,但也有点缺憾。毕竟是 AI,有些内容直接就会拒绝翻译了,这也无可厚非,这是相较于机翻的一个缺陷。在 X 上冲浪时最为明显,毕竟 X 上的信息,懂的都懂。
还有就是似乎翻译范围扩大了一点?不知道是不是我的错觉。GitHub 把用户名也翻译了,翻译就翻译了还会注解一下它的理解,弄得有点混乱。
不过总的来说还是挺好的,我挺满意的。
虽然这话从我口中说出来有点不要脸的感觉,但我的确是觉得没啥学习英语的必要了。
我对英语没啥感觉,不像有的同学对各种语言抱有热忱,我只把英语当工具罢了,而且属于是又不喜欢又不得不用的工具。
没有英语课后很长一段时间我都不再对英语付出些什么了,单词也不背了、文章也全看翻译了(这个倒是早早就开始了)。
我倒也没有后悔啥这样偷懒导致英文水平止步不前甚至退步,因为我不会再坐回英文的考场了。我的英文阅读、英文表达,全都可以靠其他工具来代劳,以前是机器翻译,现在是 AI。阅读上面说了,表达则在一个 issue 及其衍生 PR 呈现了,除了 issue 正文是我硬生生憋出来的野鸡英语外,其他基本都是 AI 代劳,非常合适。
作为工具,我只是让英文回到了它该有的位置。
当然其实还并不能完全取代就是了,例如 PDF 还做不到(指完美的方式),例如图片等等。但这些暂时不会在我涉及的范围,因为我大部分活动范围就是网页了。
可能有人会说,完全依靠 AI 这种工具,就等着给它蒙骗吧。
我没那么傻,AI 做的我会检查的,这也就是我认为过去也许有十多年的英语学习经历的唯一作用,帮助我核验。大部分翻译内容我不需要看,通顺、意思大差不差即可(上面腾讯机翻是特例,属于是腾讯水平太次了),只有不太通顺、有点奇怪的地方需要我复核。而生成的文本,废话,我肯定要自己看一遍啊,不然鬼知道里面会不会有啥「Z 世代青年」等等。
此外,照这样说的话学习英文还不够,我还得学习日语、俄语、法语、西班牙语等等。拜托,我真没那么多精力,这些是不可能学的,只有靠翻译。被误导怎么办?那能怎么办?当然是继续提高质量,减小被误导的概率呗。难不成真的抱起语言书开始啃?
很好,把我对英语的怨念发泄出来了。我是觉得英语的重要性应该降低。不是说要踢出必修这样极端的看法,而是说让它彻彻底底回归到工具的本质。有一部分人可能对英语有热情,但绝大多数肯定是将其作为一门工具的。尤其是现在这个工具可替代性很强,我是觉得可以降低它的重要性的。所会的,只需要是核验的能力罢了。像是在高考中,英语就可以从 150 分降到 100 分这样。
我这样说可能是有点情绪在,但我觉得还是有点理性在里面的,不完完全全是我的不满和私货。毕竟真要说,我英语虽然差,但高考也是有 135+ 的,虽然卷子比较简单,跟其他同学比起来可能不算什么,但也绝不是拖后腿的科目。我对 120- 的语文都没说什么,我也没认为语文的重要性该下调,下调英语重要性反而上调了语文比重,对我还更不利。这也说明了我并不完全是从自己的角度出发。
21 日
先讲个刚刚做的。
Benchmark
去年四月的时候提到了我 WSL 有两个 alias,即 clip
与 past
用以在 WSL 进行管道的复制与粘贴。这个功能看起来非常有用,但其实我实际基本没用过。但这不重要,因为这确实是看着就很重要。
之前怎么样的点上面的链接就能看到了,所以重点其实不在这。重点是我后来又进行了部分优化,因为这是要调用 Windows 的 PowerShell 的,一个不小心就速度哐哐慢。所以我网上搜罗选项往上带,目前是这样:
1 | alias clip='powershell.exe -NoProfile -NoLogo -NonInteractive -ExecutionPolicy Bypass -Command "chcp 65001 >\$null; clip.exe"' |
主要就是不要加载配置,这个大概是最耗时的。
但其实我还有想过,用 pwsh
会不会更快点呢?用 powershell
其实更是为了兼容,pwsh
新一点,会不会性能更好。但实际体验感觉是慢了一点。
另外还有,为什么用的是 clip.exe
而非 Set-Clipboard
?这样跟下面不太匹配,是有什么考量吗?
于是我晚上一时兴起,原先的计划抛到脑后,装了 hyperfine 即刻开始测试。
测试过程中发现,我一开始不用 Set-Clipboard
可能没有特殊的原因,就是因为会报错,不能直接把 clip.exe
换成 Set-Clipboard
,我也懒得研究了,就这样了。
测试用了一个小脚本 pre.sh
如下,用以定义参与测试的 alias(虽然是定义为函数):
1 | grd() { dd if=/dev/urandom bs=78642 count=1 | base64; } |
也就是说要用 Set-Clipboard $input
才行。
另外 grd
,也就是 Get Random Data,是获取随机的大概 80K 大小的正常字符。这个量已经不小了,正常一般来说没这么多。
测试是这样进行的,首先测试一下 clip.exe
v.s. Set-Clipboard
与 powershell
v.s. pwsh
:
1 | $ sudo -v |
获取一阵子 sudo 权限,因为要清理磁盘缓存(我还试过热缓存,但最终感觉清理磁盘缓存比较合适)。-i
以忽略错误,因为它有时候似乎不会正常返回值。
结果如下:
哇,可见 pwsh
完全给 powershell
爆杀了,能被我感觉出来果然差距就是不小。
而 clip.exe
似乎略胜 Set-Clipboard
一小筹,但差距其实也不大。
然后第二轮测试抛弃 pwsh
,看看 past
的定义是否会对结果产生显著影响。
1 | alias past1='powershell.exe -NoProfile -NoLogo -NonInteractive -ExecutionPolicy Bypass -Command "Get-Clipboard"' |
可见 past1
其实就是 past
,past2
就是换成了 pwsh
。
结果如下:
也是差距相当小,但是 past1
似乎还是略胜一筹。也就是说我现在的定义应该就是最优的了。
不过这个测试虽然比之前的感觉法、time
法严谨多了,但其实还不够。例如 pwsh
参数的影响(虽然说加了这么多参数还菜成这样,没救了)、alias 与 function 的影响等等,这些我懒得考虑了。
而且测试时还发现非常诡异的,原先 past1
与 past2
也是在 pre.sh
中定义的,但是结果却非常异常,非常诡异,后面才去 ~/.bashrc
定义。
然后就是测试后非常混乱的剪贴板了:
WSL DPI
上面提到在 WSL 运行 PowerShell,我重装的时候还记录了重装后运行 WSL 出现 PowerShell 的一个错误,当时懒得去细究原因,于是就不了了之了。
不过前阵子不堪忍受 WSL Zsh 的缓慢,去检查了下配置,发现了这么个玩意:
1 | # https://github.com/microsoft/wslg/issues/590#issuecomment-1370907215 |
不仅仅是定义,还在下面执行了。
然后我定睛一看,好家伙,原来每次加载都要跑一次 powershell
,难怪这么慢啊。原来是在这里出现的 PowerShell。
这是我挺早之前抄来的了,解决 WSLg 相关缩放问题,具体忘了。禁用后缩放会非常小。
但不要紧,可以看到这其实就是计算了个值而已,我只要算一遍就够了,用不着每次启动 Zsh 都算一次。所以改成下面这样就可以了:
1 | export GDK_DPI_SCALE=3 |
然后一算出 3.00 我就乐了,正好是之前自己试出来的经验值。
PowerShell
接着东风,继续讲一讲 PowerShell。
重装时就说过了,迟早要把 Git 处刑,换成 MinGit。今天上午放学的时候脑子一热就 scoop uninstall git
+ scoop install mingit-busybox
了,装的还是 Busybox 版的。
当时简单测试了一下 git status
没问题,就感觉万事大吉了。结果下午就出事了,git log
似乎没有 less
了,显示也似乎有点问题?不过小问题。但下午 commit 的时候要 GPG 签名,直接报错,msys2 版本的也不行,只好灰溜溜地装回 Git。
不过上午脑子一热的时候,顺便把 WT 的 Profile 删了,所以似乎就成小丑了,毕竟我定义了点 alias,主要是博客的。
但没事,迟早得去除这个 Profile,事不宜迟就今日吧。于是今天就配了点 PowerShell 的配置,定义了点 alias,可累死我了平时打全称,跟 WSL 习惯不合。
现在也的的确确再也用不到 Git Bash 了。喜报,啊故人再见。
Moodle
我宣布谜题告破,原来 Moodle 就是 SELearning。
太难绷了,一个月前把我吓退的 Moodle,原来就是所谓的「教学支持系统」。
这学期软工二作业描述里也出现了这个 Moodle,我又是一呆,我这是又漏了啥重要信息吗?
一查(我当时也查过,但却是没认出来),Moodle 长这样:
现在有了目标,我再去看 SELearning:
乐了。
真无语,能不能统一个名字啊,这个平台我已经听说了好几个名字了,SELearning, Moodle, 教学支持系统、教学支撑平台,最无语。
PotPlayer
昨天给朋友演示 PotPlayer 字幕字体自动加载,结果翻车了。
后面去看设置,改了个「ASS/SAA 输出引擎」,默认是「使用默认输出引擎」,改成了「全部使用 libass」,就正常了。然后我就把效果发给朋友了。
结果跳到别的时间,上面的字幕字体就不能正常显示了,框框形状,下面的就可以,又出事了。
不过我很快像柯南一样,灵光一闪,直接查 PotPlayer 更新日志。毕竟这个之前都不会的,怎么现在会这样呢。果真给我查到了:
[250226]
- Added the ability to output ASS/SSA subtitles using libass
[250313]
- Fixed an issue where certain ASS/SSA subtitles would not work properly
前阵子确实手欠更新了 PotPlayer,好在更新前机智导出了配置。后面果然发现出问题了,更新后还是强制开启了保存配置到 INI,但是又不生效,所以还得手动关掉,再导入注册表配置。
于是只好再更新一下修复这个问题。真滴恶心,要不是配好了一定要研究点别的。不过迟早也要换掉。
但看更新日志,libass 是新加的?那之前怎么不会呢?奇怪。
Scoop 更新
Scoop 很好用,非常好用,我也要为它唱赞歌。但是确实有一些应用是没那么好用的,主要就是些我 hold 住不更新了的。
之前已经提到过一些了,不过现在还要再补充一点。
首先是 MSYS2,这个更新后装的 Clang 与 UCRT 环境直接丢在原地。哦,写到这才想起来,这个说过了。
那就是昨天还是前天更新的 Clash-Verge-Rev。之前用的是 CFW,后来改用了这个。嗯,在维护的确实是比 CFW 好用。
这个要更新也是麻烦无比,因为更新要关闭,关闭就连不了网、下不了安装包了,陷入一个怪圈。
当然我找到了一个破圈的方法,那就是先用 scoop download
下载包,然后关闭,再 scoop update
来更新。但是 Clash-Verge-Rev 更新还挺麻烦的,要 sudo
,然后点两次 UAC。太麻烦了,跟 PotPlayer 有得一拼了,也 hold 了。
补充,发的版本似乎有点问题,2.2.0 后又有个 2.2.1,但是下载的时候找不到,好像撤版了还是怎得(去 GitHub 看是 alpha),退回到 2.1,后面才又有。然后安装过程其实省略了一部分,按顺序需要执行的命令:
sudo download clash-verge-rev
- 关掉 Clash Verge 及相关服务,直接关应用的话还需要
sudo pwsh -c 'Stop-Process -Name clash-verge-service'
以关掉服务 sudo scoop update clash-verge-rev
- 重新打开 Clash Verge,点两次 UAC
诶,微信不知道说过没。微信也是,每次更新要改存储的位置,说不定下次重装我就不用 Scoop 管理微信了。
刚刚 scoop update
了一下,Calibre 发大版本了,到 8.0.1 了。不过 hold 了不更新,理由之前也讲过了,诡异的配置位置,不敢尝试。而且刚发大版本,要更新也得等一会修点问题吧(真不像是我,而且还是我不怎么用的程序)。
Azure
月初的时候 Azure 发了个邮件给我,提示我 Basic SKU 要废弃了,转到 Standard SKU。不知道 SKU 是啥?我也不知道,但我知道在配置 Azure 服务器的时候,就是要选择 Basic SKU 而不是默认的 Standard SKU,避免静态 IPv4 扣钱。也就是说后面就免不了这个费用了。
好在还能苟延残喘一阵子,等一阵子看看有没有解决方案。因为这个月底才无法建新的,而到九月底旧有的才会给停止,还有半年的喘息时间。
按键
好消息,J 大哥 6434 记录破了之前 Ctrl 的 6121 的成绩,算是一雪前耻了。
坏消息,第一的名头依旧不是 J,而是——AppsKey,7607 次。
这个消息出来时,大家都很惊讶,纷纷在问,AppsKey 是谁?
这个键甚至在我的笔记本上看不到,在全键盘上在右 Win 与右 Ctrl 之间。
怎么会是这个键呢?这就要归功于一个 AHK 脚本了:
1 | AppsKey::LButton |
前阵子再也无法忍受鼠标的卡顿了,发觉大概是因为左手持标的原因,接口在电脑右端,连接不畅。于是换成了有线的,无奈有线的按键声音太响,只好再度开启了这个脚本,用键盘代替按键。
不过新鼠标已经到了,明天就去领。今天太墨迹了,七点出头去快递站,结果才发现七点关门。我已经好几次这样碰壁了。
7k+ 这个成绩是 3.17 创造的,3.16 也超过了 6k,到达了 6230,3.18 也有近 5k5。不过近两天都只有两位数,显然是有问题的,看来它的成绩有点看运气。
当然,这个还是算有点作弊的,所以 J 哥依旧是一哥。
不过它这个记录是在 3.5 创造的,我寻思 3.5 也没干啥事情啊。3.5 是周三,没有要记笔记的课(何况现在记笔记用不着那么累了),GitHub 也没贡献,公私博也都没更新(要说 3.4 我还稍微能理解一点),有点奇怪。看了看那天的记录,也没啥特别的,WT 最高,但也就 3.5w,也没多亮眼。
Mermaid
Mermaid 在 v11 版本似乎默认启用了 Markdown?这个挺早之前的事了,之前看离散笔记的时候发现 Mermaid 出问题了,只不过这学期初才去修然后发现了问题。
其实也不算啥大事,不过既然记在里面了,就一并讲了吧,也是这个月目前最后一个。
结语
今晚还写了不少,现在也快到点了,暂时也没啥可写的了,所以就来点结束语。
本来今天没这个计划写东西的,是有正事要去做的。不过晚上一直在墨迹,七点多才回宿舍,快递没取着,晚饭也没吃。第一次去门口那个便利店买了盒面吃,好贵,优惠了 10 块还是我一顿饭钱的价格(15)。
哦,说到这,可以讲讲吃饭。除了刚开学吃过一次辛拉面外,再没吃过了。
我很有进步了,这学期自己看电影、自己去医院,现在还能自己开发新就餐点了。
似乎是游泳课?一般来说中午下课我都是去十六食吃的,吃几乎不用排队的面。但是那天好像排队的还不少?三楼转了转也没啥满意的,就饥肠辘辘地去十七食了。
结果很出乎我意料,十七食二楼,也就是要通过那个我走一次就要边笑边骂的那个旋转楼梯的那个容量不大的地方,居然很不错。所以到现在我大部分都是在这里就餐了。
然后回到结语,正事没做,写了这个,倒也算做了点事情了。不过这段时间(保守估计这个学期吧)可能写的也不会太多。像私博那样荒废了的可能性倒不大,我不会让私博的惨案发生在公博记事的,但次数、内容应该是会少不少的。
首先就是项目作业,可能会占用大量时间,即使没在做正事的时间不会减少多少,但写这个的时间就会相应压缩了。
还有就是稍微有点小目标了,暂时还无可奉告,而且极可能中道崩砠,我后面没提了就是中间放弃了。这个耗时间也只会多不会少。
更何况我还想抽出时间做点自己想做的事情。所以说,这块板就自求多福吧。
28 日
今天我摆烂了吗
唉,摆烂。
看了看这个月写板的日期,7、14、21、28 齐活了。
真的是太太太太太摆了,从晚上计划要写到十点多才正式动笔就足以印证了。
摆的同时又太太太忙了,明明这个学期是课最少的学期了,明明摆烂似乎有所减轻,但是就是作业欠了一屁股、想做的事情还是没有开始做。
今晚又又没吃上晚饭,昨天六点三十多还是四十多才到食堂,等吃完的时候就我一个人了,而且也有食堂员工吃完了,而我还在看着搞笑视频傻乐。
然后痛定思痛,已经晚饭拖延好一阵子了(晚上没课就容易这样),再也不能这么晚吃了,明天一定要六点前就去吃饭!
于是今天六点四十多的时候就在路上快步苦笑,又要重蹈上周五的覆辙了。
上周五没啥胃口,一直拖到了七点多才有点饿,这时候肯定没法吃食堂了,于是第一次去宿舍门口便利店买了个泡面,还有个优惠卷,25 - 10 = 15。当时好像还听收银员说每周都有,我心里还笑,哈,我怎么可能每周来呢。
于是今天 25 - 8 = 17,啧,少减了 2 元。
周一计划要把项目的用户模块弄完的,结果现在前端还没合并进主分支,这两天也没写。然后周一也是项目计划的时间,按计划第二个模块应该完成个一半了起码。
用户模块还有两个 open 的,一个是 API 那块响应的格式还没完善的 issue,记录下来提醒我,另一个就是前端的 PR 了,还有些零零碎碎的东西,我代码也还没核验完。
甘特图,哈哈,落后一个模块了。
不过即使到现在我也自我感觉良好,毕竟这个是项目起步阶段,我自己也是在摸索最合适的路径,也是在为后续搭一个框架,因此这第一个模块耗费的精力肯定是要比后面的多不少。要是这个完成了,后面的应该能轻松不少的。
四月
三月还有几天就要结束了,接下来的四月应该大活不少,待我盘点一下。
首先是四月一日,有愚人节等,另外有个沉寂了三年的东西不知道会不会复苏,尽管我其实也不咋关注。
然后是四月六日,应该是现在已知的可能四月最重要的一天。
再紧接着的是四月十三日,我的半个「生日」,顺带一提另外半个是五月十五日,当然,都不是真的生日。
最后应该就是四月十七日,是一个暂定的重要日期,按目前测算的三周年纪念日。
四月底好像还要两千四测试?我现在复健尚未完全完成,还没能接近上个学期的最佳纪录。
笔记
唉,我已经躺平了,我已经成为了 AI 的前端。我这具躯干包括大脑,完全是 AI 的外骨骼,实现 AI 与外界的交互,代替我做有意义的事情。
网上有种说法,AI 助力越多的岗位,越有可能给淘汰,因此有的人反而是羡慕那些 AI 没啥帮助的。
虽然我感觉就是扯淡,但的的确确是感觉我好像没啥能做的了。而且我抵制诱惑能力很差,已经滑坡一滑到底了。AI 仿佛毒品一般,一沾染就回不去了。一打开作业心中一团乱麻,先打开 AI,例子很多,但太丢脸了,就不说了。
这样干的人绝对不少,甚至有很多是像这样干都没得干的,这点我相当确信。
但我即便如何自贬,如何自嘲,也都不会将这些放在眼中的,因为完全不在我的关注范围内,我明面上是不会将自己与之相提并论的。
但我确实痛心于自己的沉沦,我虽然不知道理想的我是什么样子的,但我敢肯定这确实不是我想要成为的自己。唉,只可惜,这更像是一个吸毒的人偶然清醒,向身旁的路人倾诉自己的不甘于悔恨,然后继续沦陷。
抛开这些负面情绪不谈,这 AI 可太棒了!嗯,现在是磕嗨了的状态。我确实是学到了很多之前可能要花点功夫才能接触到的知识,很有意思,我很欣喜在这样一个强力的辅助学习的工具横空出世之前,还保有着一定的求知欲。
然后就是这学期笔记形式发生了天翻地覆的变化,这学期的笔记质量相较于之前应该会有不小的提升,当然前提是我后面有复习并理解。其中的关键助力就是 AI 了。
之前的笔记记录形式很简单,我这个人一看也不是会预习的,上次预习估计是小学的预习作业了吧?然后后面的预习我都是当成空气的。那就只能课堂上记录了,一般就是分屏成两块,右边终端 Vim 记笔记,左边一般至少开两个,主要是课件 PDF,偶尔还会看看 Markdown 预览结果,当然有的时候还有教材的 PDF。
然后上课就是尽量跟上老师的节奏记笔记,或者说,抄课件/教材。课上还是挺难理解的,我之前也有说过,课后看笔记时一下子就理清的逻辑,记录的时候却是一头雾水。
当然这样的情况还是比较少见的,更多的是看笔记也一头雾水,毕竟我只是一个无情的摘抄机器人,自己的理解部分不能说没有,但确实是寥寥无几。
而且想要跟上老师,难度也是相当大的。就拿上学期举例,《机器学习》课程就是基本跟不上老师的,所以常常要课后抽点时间,补了笔记。但其实现在看来真的意义不大,中期往后的东西,我真的是一点都看不懂哇。
然后我课上是如何提速,尽全力跟上老师呢?除了基础的 Vim + Snippets + Copilot 外,还有就是 OCR + 复制了。PDF 有时候可以直接复制,不行的时候,就可以用 OCRC 来完成。OCRC 不再是我最骄傲的孩子了(目前是 Avsb),但它却是最有用的一个,我很庆幸我当时为了这灵光一现付出的精力,那时候折的纸飞机的的确确在现在回到了我的手上。普通文本虽然也能用 OCRC,但要是可以直接复制,为何不呢?确实如此,最常见的用例就是公式鳞次栉比的状况,这时候 Mathpix 就十分好用了,虽然标点处理我相当不满意,但是比起手敲,还是方便不少了。
当然,这些都是旧时代的马车了,现在不管是 Snippets 用以快速输入、Copilot 进行联想预测、OCR 瞬间截取还是什么,都直接给 AI 干碎了。
我依旧是不预习,上课前的时候把课件丢给 AI,配上自己调配的 prompt,随意喝口水,随便看点东西,几分钟后再看回来,一篇质量不低的笔记就出炉了。
这一套连招我从开学一直摸索到现在,大致形成了一套规范的流程,颠覆了之前花费大学一个半学期逐步构建的笔记记录系统,已经基本趋于完善了。而且更令人吃惊的是,之前的体系基本受我个人能力的限制,已经没多少进步空间了,但是这一套全新的系统,即使我不做任何改进,它也会随着 AI 的进化自动进步优化。
当然现在还不是很完善,生成出来的笔记我还有不满意的点,但基本上都是在格式方面挑剔,内容方面我确实是叹为观止。比如今晚为何没有早早去吃饭?确实有下课后随便看看墨迹了一下子的缘故,也有修正笔记时被惊讶到了,硬是要坚持看完的缘故。《操作系统》课没怎么听,基本是在挑笔记,生成了几个结果我都不大满意(下面会说原因),最终好不容易选了一个作为基底,又要进行各种方面的修正,再加上又一直分心看点别的,实际上没咋听,而且修正也没完成,于是就打算吃晚饭前弄完。
修正的过程就是对着课件,从头开始对照着笔记进行「检查」。然后我很惊讶地发现这篇笔记的结构非常好,条例非常清晰。要知道我课上是没怎么听的,而且持续了一段时间,前面的基础也不牢靠,也还没来得及回去打基础复习笔记(甚至前面笔记估计还没修整完),但是我看完后居然自认为理解得不错,没有不解困惑的地方。
这样说不太具体,我还得细化一下。操作系统课程老师的课件很喜欢先给出错误实现,逐步到正确实现(应该是老师的个人风格,上学期的算法课也是这样的,因此看算法笔记就有这样的影子,因为那时候我是照抄的),这样用于教学很好,有助于逐步建立认知,即这里为什么要这样、为什么不能那样,但是作为笔记其实我认为是非常差劲的。因为我的笔记是用来事后进行复习的,还重复一遍这样的学习路径其实非常多余,很没必要,重点分散。
但是 AI 给出的笔记很好地解决了这点,但同时也不至于陷入到直接抛上来正确答案,但你自己也不明所以的境地。比如说还是这篇笔记的「利用信号量解决生产者-消费者问题」部分,它直接给出了正确答案,用了三个信号量,而且 P 操作顺序也是正确的。而课上老师则是给出了两次错误,第一次没有锁,第二次 P 操作顺序反了。那 AI 有没有相应的解释呢?也有,就在正确答案的后面,给了一个 warning,告知了 P 操作顺序问题导致的死锁陷阱,非常清晰明了,即使我上课没怎么听(当然,这部分听了),只看这个笔记我也能理解。再然后还有一个也说明了为何要多用一个锁来保护的原因,比起原课件冗余信息少了,但是知识信息没少,也不会造成理解障碍。
此外还有就是给课上的代码添加了详尽的注释。要知道我没听哎,加上我不喜欢看不是自己的代码(自己的其实要是不是亲生的而且引以为傲的孩子,也不喜欢看),理解会很吃力费劲。但是充分的注释,让我在课后都能重新学习,这真的是太棒了。
那为何我最前面会说我不满意呢?笔记的内容质量很难一眼看出来,但是笔记的花哨程度、格式却是能一眼看出来的。我不满意的原因就在于我详细要求了格式,但是它的格式还是时不时崩坏,因此我要自己修正问题,主要是各种标点、空格、语法问题。
根据我的经验,Qwen 的 Markdown 喜欢大标题后立刻接正文,同时不同标题部分喜欢再用个横线分隔。实际上我用横线是比较克制的,因为我感觉大标题已经起到了内容分隔的作用,但横线从视觉效果来看分隔效果比不同标题还强烈,因此我会很少用。
1 | ## 标题 |
另外 Qwen 对指令遵从水平也较差,生成的笔记内容也比较贫瘠,所以在前期的模型大乱斗后就被逐渐淘汰出局了。
最终胜者是 Gemini。最初我是让 R1, Qwen 以及 Gemini 2.0 Pro 三个都生成一个看看效果的。不过 R1 终究不是多模态,对课件内容、结构的理解还是差了点。而最终是 Gemini 赢得了胜利,因此我现在笔记基本直接丢给 Gemini,不再进行试验比较了。正好前几天出了 2.5,更是兴冲冲换上了。
不得不说 Google 真的是财大气粗,虽然说我对 Google 不像 Microsoft 那样抱有一点好感(软爹他给的实在是太多了,GitHub Pro, WSL, VS Code 等等),基本是无感,但就冲着 Gemini,我不得不说 Google 真的就是大爹。Gemini 好用就罢了,Pro 还能免费额度用,而且也不算少。所以我要记笔记的当天,非正经的问题就少问了,尽量留出来给笔记用。而且 Gemini 响应速度快,一次响应内容就是一大片,很好。当然今天有点翻车了,操作系统开始试了好几次过了很久都没响应,耽误了不少时间,也算是没怎么听课的原因之一吧。
Gemini 也有不遵从指令的情况,比如我上面夸的那篇笔记就是好像是第一次生成的,但我瞥了一眼就很不满意,所以才会多生成几个。因为生成到后面我就看到了标点问题,属于是我反复强调的问题了。此外 Gemini 的 Markdown 也有自己的风格:
1 | * 我 Gemini 大爷喜欢用 `*` 表示无序列表 |
不过这种属于是比较容易替换的了。
内容确实是很难一眼看出来质量高下,但是这种格式确实是一扫一个准的。我早已练就了火眼金睛,标点是全角还是半角一瞥便知。加上我对这个其实挺有强迫症的,要求还是蛮高的,像我这样的人其实相当少,所以说还算得上是我的一个「缺点」吧。
当然为何今天才感慨呢?也是因为并不是每篇笔记都那么高质量。就比如 NLP 笔记就没办法,我机器学习学的一坨,你质量再高,我基础都看不懂,那能怎么办?
然后再总结一下我目前笔记生成的范式。
在系统 prompt 里大概讲了点要求,比如笔记的用途啊什么的,然后把具体的格式要求写了进去,但看来是遵从效果不大行。然后就是后面看到生成结果遇到了可以补充的地方,例如生成了数学公式,如 Softmax 函数用的是 \text{Softmax}
,我就加了个要求这种运算符要用 \operatorname{Softmax}
,可见渲染效果虽然是一样的(其实有点差异),但是前者的含义是 text,也就是文本,而后者才是真正的 operator,即运算符。还有个例子就是 \vee
和 \lor
了,后者才是 logical or。
然后正式 prompt 中,我之前只是加了个要求,然后附上课件。不过我现在另外加了个,那就是附上前面的笔记。例如说操作系统就是上一章的笔记,一章分好几部分的数据库就是前面部分的笔记,以作为内容和格式的参考(当然,这对内容质量有一定要求,等后面多了可以选取质量高的。格式质量不会有低的,只是会有不全的)同时再说一句我对哪几方面不太满意什么的,再附上课件。当然我也没测试过「不满意」话术有没有提升,但是给上参考还是有一定作用的,加上 Gemini 白嫖,也没啥心理负担。
当然,这样就出现了一个新的问题,或者说是旧问题的全新演绎。那就是课上专注于改笔记的格式了,而非关注笔记本身的内容。例如上面操作系统的笔记我是后面看才发觉内容的质量之高的。只是这其实前面的系统也是有的,我机械式地摘抄的时候,一样是会调格式什么的。只是我本来想着减轻了记笔记的工作量,课堂上就能更游刃有余,可以多关注老师讲课的内容,可以自己看点相关资料,也可以享受一下笔记,结果我是去让 AI 生成点 Mermaid 图像(确实可以看到这学期笔记出现了一些高质量的 Mermaid 图表,上面的操作系统的笔记的时序图就相当好,非常直观)。
同时,本应该是大大减轻工作量的进步,结果我反而进度落下得更多了。希望能在期中前补救一下吧。
按键
今天只有不到二十分钟了,不过 J 键到现在已经 7k 出头了。
其实我挺惊讶的,之前周五概率论加算法,拼命抄课件都没能上的 7k,怎么这学期记笔记工作量减轻一大票后,上了几次了呢?甚是奇怪。
就是一周前的 21 日,也是周五,J 就拿到了 7572 次,虽然还是没能击败 AppsKey 的 7.6k,但也确实让它再一次证明了自己。
再加上今天也有 7k 加,我就挺好奇的怎么回事呢?不会是因为浏览用的 J K 其实贡献率远超实际记录吧?那我似乎可以理解了,JK 实力强劲但是 WT 却没能表现出来。
不过今天时间不多了,我再看了一眼才到 7.1k,估计今天上限就是 7.2k 了,看来是破不了记录了。但是未来可期。
Keitai
这周建了个仓库,名叫 Keitai-AI-Fiction,Keitai 按 DeepSeek v3 的说法,是「手机小说」的日文。然后上传了一个短篇小说的前几章,很日式,名叫《第三个座位的沉默批注者》。
其实我已经生成完了,只不过每天发两章,很快就能发完了。看完全文的我感觉这个标题起的很不好,可能是我上下文设置的问题?不过就这样也没关系啦。
这个是 DS v3 3.24「小更新」后萌生的想法。直接试验了一下,效果很好。
我似乎有提到过,两年前 New Bing 的时候就让它生成过小说,质量奇差无比。而现在我把相同的人设丢给了 AI,不像当时作出了相当多的补充,这次我基本没加什么限制(毕竟我也没记录,早忘了),只是把当时的记录截取了抛上去,简单限制了一下题材,就完事了。
有部分人可能会有点熟悉,我还是摘取 2023 年 3 月 5 日记录的摆记(不过写这段的时候应该不是 3.5):
「江上」为 2022 新高考 I 卷语文现代文阅读标题;「听水」为 2023 广州零模现代文阅读标题(因模仿高考历史类小说而被我联想);「梓旭」即《江上》主人公「子胥」,其实应该是「梓虚」,当时没多想随便选了;「诗娟」为《听水》人物「师涓」(甚至性转)。
航航航,这就是高三人的精神状态啦。
具体设定我就不透露了,去看小说大概也能感觉出来。不过可以放一个 New Bing 生成的我当时的想法(一大坨文字一段没办法,一开始是写在本子上的):
一开始设置题材为侦探悬疑,因此还给江上加了喜欢侦探的设定。题目是《消失的钥匙》,一女子被杀,留下一字字条「你欠我 10 万」,一日一戴口罩人声称是警察要带走四人调查(看到这我就想吐槽了,带走高中生是什么操作),随后江上开始虚空推理判断此人是凶手,还是死者丈夫(更无语,且不说你知道的警方不去调查,也不说虚空推理不用去现场,凶手在学校网上找四个人随便栽赃是什么迷惑操作[现场有四个四人名字的钥匙]),然后说到公文包,说了一半给撤回了,再弄一次一半后又撤回了,体验极差。还有风头全被江上抢了,我给梓旭一个高智商设定就是为防止主角太耀眼,结果还是如此。题材太敏感了又换为校园故事,为适应变化,让江上喜欢数学,结果后面一堆数学竞赛。一开始江上要迟到,梓旭阴阳怪气(你跟他同进度不是一样),我说梓旭不是这样的人,结果二人就聊得情投意合了…然后听水师娟出现(你二人不怕迟到?),听水心中想与江上多待一会所以四人在校外傻站,且不说不符听水形象,这写的又是什么玩意,课还上不上了?然后有惨叫声四人去吃瓜,具体忘了,好像有死人,好像也给撤回一次,没后续。经常崩掉的就是梓旭,因为 AI 对设定的误解(尽管后面有强调),经常搞成反派一样。AI 创作中基本没出现其他有名有姓的人,除了一次因江上偏科,听水全能导致二人不再坐同桌,有意思的是江上和梓旭同桌了,一开始梓旭热情地打招呼我还激动地想:梓旭终于不是反派了,虽然与设定仍有不符。接下来心理描写直接创碎,原来他在幸灾乐祸…听水新同桌叫林泽,然而,接下来就让听水崩了一手,听水心理:他怎么不跟我说话,难道他不喜欢我吗。这什么**心理。
后面还有一个狗血剧情,不过我就不放上来了。还让几个 AI 试着按我的描述与当时 New Bing 的风格仿写一下,都没能达到要求。希望后面有朝一日能复现我当时的高血压吧。
不过 DS 生成的这个就完美无缺吗?也不是,虽然进步相当多,但是也有很多明显的缺陷。例如现在公布的六章(这周就能完结了),开头讲江上梓旭是学长,结果他们其实是同级……还有很多 bug。以及我观感其实也没那么好,由于没有加以限制,导致江上有股「霸总」味,看了有点犯恶心,但总的来说其实还是相当清爽的。
不过其实我也没设置啥背景啊,咋自动代入日本了,一个要东大一个要早稻田……
后面也会用 AI 继续演绎。