所有文章

Python数据可视化工具Plotly

Plotly是一个流行的开源图形库,用于创建高质量的交互式数据可视化。它支持多种编程语言,包括Python、R、JavaScript等。Plotly的Python库尤其受欢迎,因为它允许数据科学家和分析师利用Python的强大功能来创建多样…

内容分发网络CDN

CDN简介 CDN全称为Content Delivery Network(内容分发网络),它的基本目的是通过在现有的Internet中增加一层新的网络架构,将网站的内容分发到距离用户最近的服务器上,缓存内容以加速网页加载时间,提高用户访…

术→技巧, 运营 ·

语言是否会影响认知?

什么是认知? 认知这个词来自拉丁词根cognoscere,意思是“知道”。当我们谈论到认知,我们通常指的是与知识相关的一切,即我们已经通过学习和经验获得的资料的积累。认知公认的定义是通过感知处理信息的能力(即我…

志→目标, 自我提升 ·

活在卓别林的摩登时代

写给除夕还在上班的各位打工人! 《摩登时代》中的世界 故事的主人公是卓别林标志性的角色“小流浪汉”(The Tramp),他在一家工厂里工作,处于流水线的高压环境下。在试图跟上机器的节奏时,他遭受了精神崩溃,并…

观点, 道→理念 ·

自然语言处理之BERTopic

主题模型是用来在非结构数据中无监督的发现隐含主题信息的一类重要工具,比较成熟和常用的算法有基于矩阵分解(如:SVD分解)的LSA(Latent Semantic Analysis), 引入概率方法代替SVD的pLSA(Probabilistic Latent…

器→工具, 开源项目 ·

开源的中文NLP大模型

在Hugging Face上,有多个模型适合用于对中文文本的迷信。这些模型通常被预训练在大规模的中文语料上,因此它们能够有效地理解和处理中文文本。以下是一些推荐的模型: bert-base-chinese bert-base-chinese 是一…

器→工具, 开源项目 ·

自然语言处理之Subword子词算法

背景与基础 目前的机器学习模型都是数学模型,其对应的输入要求必须是数字形式(number)的,而我们处理的真实场景往往会包含许多非数字形式的输入(有时候即使原始输入是数字形式,我们也需要转换),最典型的就…

ThinkPad是如何走向没落的?

在开始之前,首先需要说明的是我原先是一个忠诚的ThinkPad用户。以下为接触过的ThinkPad产品: ThinkPad S30 ThinkPad T61 ThinkPad X61 ThinkPad X201 ThinkPad X220 ThinkPad X230 ThinkP…

器→工具, 工具软件 ·

自然语言处理之GPT

ChatGPT与GPT ChatGPT,全称聊天生成预训练转换器(英语:Chat Generative Pre-trained Transformer),是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5、GPT-4架构的大型语言模…

可缩放矢量图形SVG

SVG简介 可缩放矢量图形(SVG) 是一种基于 XML 的图像格式,专门用于在网络上描述二维矢量图形。这种格式的独特之处在于其可缩放性和矢量性质,意味着不论放大多少倍,图像都能保持清晰。 矢量图形与栅格…

术→技巧, 研发 ·