GeoMTMan

贝叶斯及最大匹配算法分词及GUI设计

贝叶斯、前向及后向最大匹配算法

夏天吃西瓜! 基于前向和后向最大匹配算法以及贝叶斯算法进行自然于然处理中的分词处理。什么是分词呢?很简单。比如:一句话“我在清华打游戏。”由于中文不像英文,词与词之间会分隔。“I am playing game in TsingHua University.”而自然语言处理过程中,有很多情况下都是基于词语进行分析,比如:舆情分析等等。因此,我们需要应用一些算法来使得计算机能够将中文语句分...

爬虫下载静态网页资源

以爬取国家地理网站图片为例

下载图片、pdf、mp4等所使用的python模块 import os os.makedirs('./img/', exist_ok = True) '''检查元素,获得下载地址''' IMAGE_URL = "https://geomtman.github.io/img/limin.jpg" way1:urlretrieve from urllib.request import ...

使用Git将本地代码上传至Github仓库

“Yeah It’s on. ” 介绍 Github是所有程序员的宝藏,Github中有众多优秀的开源项目,我们可以查看源代码学习,或者Clone到本地加以改造后得到我们想要实现的效果。对于每个用户自己的本地仓库Repo中的各个项目,在项目管理或开发过程中,我们需要不断将本地新添加或者修改的代码同步至Github对应的项目中,对代码进行存放,并且其他同一项目的开发者也能看到相应的...