
【抓取】
sunshine0625
只要每天不在原地,就好
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
爬虫抓取
爬虫抓取的方式有两种:1.简单import urllib2dir(urllib2)urllib2.urlopen(url)html=responce.read()2.复杂import urllib2def make_opener(headers=None): cookie=cookielib.CookieJar() opener=原创 2016-07-26 20:04:39 · 390 阅读 · 0 评论 -
git入门
1.初始化版本:git initgit remote add origin http://gitlab.baidu.com/i18n_crawl.git2.添加密钥:cd ~/.sshlsssh-keygencat .pub3.git设置邮箱和密钥: git config --global user.name "yang" gi原创 2016-07-27 19:54:18 · 268 阅读 · 0 评论 -
awk基本操作
$0变量:它指的是整条记录。如$ awk '{print $0}' test将输出test文件中的所有记录。变量NR:一个计数器,每处理完一条记录, NR的值就增加1。如$ awk '{print NR,$0}' test将输出test文件中所有记录,并在记录前显示记录号。eg:awk '{print NR,$0}' abcawk中的数组的下标可以是数字和字母,原创 2016-07-28 18:23:46 · 429 阅读 · 0 评论