词向量相似检索 - RAG初探
使用BERT的词向量生成 from transformers import BertTokenizer, BertModel import torch # 初始化分词器和模型 tokenizer = BertTokenizer.from_pretrained('bert-base-uncased') model = BertModel.from_pretrained('bert-base...
使用BERT的词向量生成 from transformers import BertTokenizer, BertModel import torch # 初始化分词器和模型 tokenizer = BertTokenizer.from_pretrained('bert-base-uncased') model = BertModel.from_pretrained('bert-base...
好的,因为选型问题,还要在来一遍ES。但是开源的已经是OpenSearch了,所以… 官方文档在这里,可以查找到本笔记的来源。并且其中有详尽的安装文档。 简介 OpenSearch 将数据组织成_索引_。每个索引都是 JSON_文档_的集合。单下划线前缀的,是opensearch自己添加的一些元素。 OpenSearch 将索引拆分为分_片_,以便...
csblog 好文 写在前面 因为项目的需要,开始接触模型推理(Model Inference)和模型服务化(Model Serving),即模型部署(Model Deployment)。近期在做PyTorch模型部署有些学习心得,趁热打铁记录下来。如果文章中有纰漏,非常欢迎斧正! 本文需要读者对torch有一定的了解,因为本文将讨论的重点是torch的模型保存的加载的办法、当前基于...
什么是监督树 我觉得监控树就是一种以树的形式管理多个进程/线程/协程(后面统一说进程)的程序设计模型。这一种模型基于 worker 和 supervisor 的思想。 worker 就是用于工作的进程。 supervisor 就是用于监控 worker 的进程。supervisor 在某一个 worker 出问题的时候可以重新启动 worker。 ...
跳表(Skiplist)是一个特殊的链表,相比一般的链表,有更高的查找效率,可比拟二叉查找树。跳表的查找、插入、删除时间复杂度都是O(logN)。 许多知名的开源软件中的数据结构采用了跳表这种数据结构,例如: Redis中的有序集合zset LevelDB、HBase中Memtable ApacheLucene中的TermDict...
背景 Content Delivery Network CDN缓存一般是由网站管理员自己部署,为了让他们的网站更容易扩展并获得更好的性能。通常情况下,浏览器先向CDN网关发起Web请求,网关服务器后面对应着一台或多台负载均衡源服务器,会根据它们的负载请求,动态将请求转发到合适的源服务器上。从浏览器角度来看,整个CDN就是一个源服务器,从这个层面来说,浏览器和服务器之间的缓存机制,...
什么是正向代理和反向代理 正向代理 假设我们现在要访问Google,但因为众所周知的原因,我们的请求发不出去。此时我们在本地配置了一个代理服务器IP,比如 192.168.1.100。当我们输入 www.google.com 时,请求并没有直接发向谷歌,而是发给了这台代理服务器,由它代替我们去请求谷歌,再把结果传回给我们。 这样做的话有个特点,对于谷歌的服务器来说,它只知道是 192....
名词解释 Pod:Pod是Kubernetes中的最小部署单元,通常一个Pod中运行一个或多个紧密相关的容器。Pod中的容器共享网络和存储资源。 节点(Node):节点是运行Pod的物理或虚拟机。节点可以是Master节点,也可以是Worker节点。Master节点负责整个集群的管理和调度,而Worker节点则用于实际运行应用程序。 ...
简介 待更新 问题 ENTRYPOINT 可以覆盖以前旧版本的CMD`ENTRYPOINT 至此,可以对其他人的docker镜像进行进一步封装,再调用自己的ENTRYPOINT` docker run image [COMMAND]多用于从外部传入启动参数 空间清理 删除悬挂的镜像:这些是未标记或未使用的镜像,可以...