Chouzz's blog

从 0 到 1 搭建 vLLM 网关:用 Kong Gateway 打造可观测、可控的推理服务

背景 在企业内部部署 vLLM 提供大模型推理服务时,如果直接把服务端口暴露在内网,往往会遇到下面这些“裸奔”问题: 无权限控制:API 地址一旦泄露,任何人都能调用,GPU 资源容易被滥用。 无流量限制:某个脚本写了个死循环,瞬间把显卡打满,其他同事的任务直接被拖垮。 无监控审计:不知道是谁用了多少 Token,很难做成本核算和容量规划。 协议兼容性差:希望完全兼容 ...

Typescript的前世今生

JavaScript的由来 JavaScript并非凭空而来,它本身出自浏览器,最开始是用来嵌入到浏览器网页上,执行几段代码的,例如,当时的网速很慢也贵,有些操作不适合在服务端完成,比如输入用户名密码时,如果用户忘了输入密码,直接点击发送,到服务器发现这一点就太晚了,需要有一个小程序在用户没有填一下密码的时候给出一个提示。1995年,Microsoft推出了Internet Explorer...

白夜行读后感

文章先开始介绍了一宗谋杀案,桐原良介被谋杀了,而他老婆以前是做妓女的,和他的店铺的店长有点可疑,但是又没有什么特别的证据,他有一个儿子桐原亮司,然后警方又找到了他临死前去的地方,也就是西本文代家,西本文代有个女儿,自己也是那种高冷美人,老公七年前就死了,家里比较平穷,有一个很可爱很聪明的女儿,西本雪慧。 第二章讲的是秋吉雄一是个玩摄影的穷小子,他被派去偷拍雪穗,他有一个好基友菊池文彦,然后...

二分查找-BinraySearch总结

前言 二分查找(Binary Search)是一种从有序数组中查找某一特定元素的搜索算法。搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;如果某一特定元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较。 如果在某一步骤数组为空,则代表找不到。 算法实现(python) while 循环写法 def bi...

排序算法总结

排序算法 排序算法是计算机科学中最基础的算法之一,它们将一组元素按照一定的规则重新排列。下面是一些常见的排序算法: 冒泡排序(Bubble Sort):比较相邻的两个元素,如果前一个比后一个大,就交换它们的位置。重复这个过程,直到没有任何一对数字需要交换为止。 插入排序(Insertion Sort):将数组分为已排序区间和未排序区间,初始时已排序区间...