所有文章

自然语言处理之BERTopic

主题模型是用来在非结构数据中无监督的发现隐含主题信息的一类重要工具,比较成熟和常用的算法有基于矩阵分解(如:SVD分解)的LSA(Latent Semantic Analysis), 引入概率方法代替SVD的pLSA(Probabilistic Latent…

器→工具, 开源项目 ·

开源的中文NLP大模型

在Hugging Face上,有多个模型适合用于对中文文本的迷信。这些模型通常被预训练在大规模的中文语料上,因此它们能够有效地理解和处理中文文本。以下是一些推荐的模型: bert-base-chinese bert-base-chinese 是一…

器→工具, 开源项目 ·

自然语言处理之Subword子词算法

背景与基础 目前的机器学习模型都是数学模型,其对应的输入要求必须是数字形式(number)的,而我们处理的真实场景往往会包含许多非数字形式的输入(有时候即使原始输入是数字形式,我们也需要转换),最典型的就…

ThinkPad是如何走向没落的?

在开始之前,首先需要说明的是我原先是一个忠诚的ThinkPad用户。以下为接触过的ThinkPad产品: ThinkPad S30 ThinkPad T61 ThinkPad X61 ThinkPad X201 ThinkPad X220 ThinkPad X230 ThinkP…

器→工具, 工具软件 ·

自然语言处理之GPT

ChatGPT与GPT ChatGPT,全称聊天生成预训练转换器(英语:Chat Generative Pre-trained Transformer),是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5、GPT-4架构的大型语言模…

可缩放矢量图形SVG

SVG简介 可缩放矢量图形(SVG) 是一种基于 XML 的图像格式,专门用于在网络上描述二维矢量图形。这种格式的独特之处在于其可缩放性和矢量性质,意味着不论放大多少倍,图像都能保持清晰。 矢量图形与栅格…

术→技巧, 研发 ·

Linux环境变量的配置

在Linux配置环境变量的是否有类似的疑惑?不同的教程中的针对环境变量的方法各不相同。到底哪种方式是最恰当的? 环境变量有什么用? Linux环境变量在操作系统中扮演着至关重要的角色,主要有以下几个用途: …

器→工具, 工具软件 ·

自然语言处理之 BERT

BERT简介 BERT(Bidirectional Encoder Representations from Transformers)是一种预训练语言表示的方法,由Google的研究者在2018年提出。它在自然语言处理(NLP)领域取得了革命性的进展,尤其是在理解上下文含…

自然语言处理之Transformer

Transformer 简介 Transformer是一种深度学习架构,由Google的研究者在2017年的论文《Attention Is All You Need》中首次提出。它在自然语言处理(NLP)和其他领域取得了巨大的成功,特别是在处理长序列数据方面。…

Go语言的初步了解与学习

Go语言简介 Go语言,通常称为Golang,是由Google公司设计并开发的一种静态强类型、编译型语言。它在2009年首次公开发布,由Robert Griesemer、Rob Pike和Ken Thompson等知名计算机科学家共同设计。Go语言的设计目…

器→工具, 编程语言 ·