sklearn踩坑
这几天在做毕业设计,想做一个微博的情感分析,想着实现两种方式,一是朴素贝叶斯,二是用LSTM。
在做朴素贝叶斯的时候,据网上看到的一些文章说,训练的速度应该是很快的。但是我的训练速度却很慢,分析了一下发现是文本分词、清洗占去了大量的时间。我的语料大概12w行,20MB左右。文本处理需要一分多钟,而朴素贝叶斯的训练时间只需要一秒钟左右。
于是想把文本处理的结果,保存起来,下次直接使用,就不需要每次都多等一分钟了。
这几天在做毕业设计,想做一个微博的情感分析,想着实现两种方式,一是朴素贝叶斯,二是用LSTM。
在做朴素贝叶斯的时候,据网上看到的一些文章说,训练的速度应该是很快的。但是我的训练速度却很慢,分析了一下发现是文本分词、清洗占去了大量的时间。我的语料大概12w行,20MB左右。文本处理需要一分多钟,而朴素贝叶斯的训练时间只需要一秒钟左右。
于是想把文本处理的结果,保存起来,下次直接使用,就不需要每次都多等一分钟了。
白嫖的阿里云服务器今年七月份就要到期了,又白嫖了两年的腾讯云,于是想着把自己的博客迁移到腾讯云上。
之前在阿里云上部署hexo
博客的时候什么都不懂,是一篇篇教程试出来的。这次在部署写一份详细一点的教程记录一下部署过程。
在使用Chrome浏览器时,访问没有SSL的网页时会提醒网页不安全,添加过SSL证书之后,会有一个小锁,很好看。
HTTP vs HTTPS: https://www.runoob.com/w3cnote/http-vs-https.html
毕设需要保存大量数据,于是想在服务器上运行一个数据库。
Cent OS 默认的 MySQL是Mariadb版本的,据说这个版本是在MySQL被Oracle并购之后,一些MySQL的老员工考虑到MySQL可能被商用而发行的一个免费开源版本。
1 | $ screenfetch |