互联网中充满了具有创造性和实用价值的资源,比如照片、文章、音乐、视频和代码 。相对于自己创造轮子,寻找现有的资源和已存在的实现方法则更快捷,廉价和实用。无论是否免费,这些资源通常以某种许可协议发布以确…
日常生活中,生物识别技术已经是多数智能手机的标配,大多数手机具备人脸识别、指纹识别等功能,目前的指纹识别技术已经非常成熟。但我们今天要聊的并不是生物识别技术中的指纹识别,而是浏览器指纹。很多人对这项…
《道德经》又称《老子》,其文本在流传过程中经历了一个不断异化的过程。研究分析表明,老子最初的文本曾因竹简散乱而被错编,打乱了老子原著的章节和语句顺序;错编的母本在后人传抄过程中,又陆续掺杂了他人的误…
文件系统 文件系统是操作系统中负责管理持久数据的子系统,说简单点,就是负责把用户的文件存到磁盘硬件中,因为即使计算机断电了,磁盘里的数据并不会丢失,所以可以持久化的保存文件。 文件系统的基本数据单…
对于每一个Linux学习者来说,了解Linux文件系统的目录结构,是学好Linux的至关重要的一步。深入了解Linux文件目录结构的标准和每个目录的详细功能,对于我们用好Linux系统非常重要。 文件系统的是用来组织和排列…
程序员拥有一个较好的编程原则能使他的编程能力有大幅的提升,可以使其开发出维护性高、缺陷更少的代码。以下内容梳理自StactOverflow的一个问题:编程时你最先考虑的准则是什么? KISS(Keep It Simple Stupid) …
在听《字谈字畅》节目的时候了解到了一个新的概念:中文拼音正词法。 《中文拼音正词法基本规则》是中华人民共和国国家标准GB/T 16159—1996,1996-01-22国家技术监督局发布,1996-07-01实施。以下为摘录内容…
《Linux/Unix设计思想》是一本关于Linux/Unix设计思想的书,书中很多思想和方案值得在日常的项目推进中采用与学习。 第一章 Linux哲学:集思广益的智慧 NIH综合症 NIH是英文Not Invented Here(非此创造…
对于深度学习或机器学习模型而言,我们不仅要求它对训练数据集有很好的拟合(训练误差),同时也希望它可以对未知数据集(测试集)有很好的拟合结果(泛化能力),所产生的测试误差被称为泛化误差。度量泛化能力的…
监督机器学习的关键方面之一是模型评估和验证。当您评估模型的预测性能时,过程必须保持公正。为了制作训练数据(training samples)和测试数据(testing samples),常使用sklearn里面的sklearn.model_selection.t…