1、查看google爬虫对你网站的那部分有爬取问题2、生成提交XML的网站地图3、分析robot.txt文件4、移除你不想让爬虫爬去的部分内容,比如某个根目录文件夹涉及到商业机密,可以请求爬虫不要记录5、如果你有几个域名关联同一个网站,你能够用来确定想用的域名6、对title和meta信息的分析7、了解到达网站的最主要搜索词是什么,可以用来修改页面突出重点8、接受google的警告信,并修改后重新提交申请
google站长管理工具的功能
对于google进行网站优化需要注意的几点
1、不要把搜索引擎结果爬过来作为你的网页内容2、不要用其他自动生成页面的程序区做伪原创搜索引擎的重要判断因素就是你的网站到底给用提供了什么附加值根据某种算法编出来的内容,google的系统能很好地识别3、确保你的网页在多个浏览器里显示正常中国用户了浏览器使用统计情况如下:IE 65%FIREFOX 22%chrome 7%safari 4%opera 2%4、JS调用注意事项:1、没有恶意代码、病毒2、JS外链速度快此外Google认为www是一个二级目录
如何提高网站被爬虫爬取的效率
1、正确设置ROBOT.TXT
确保你正确使用robots.txt文件,此文件用来告诉各种网页爬虫能不能访问某个网站,能访问网站上那部分的文件。检查是否正确配置这个文件可以到www.google.com/webmasters的专门工具区。
2、理解和区分各种爬虫(蜘蛛)
google的两种爬虫:
googlebot针对网页搜索爬去内容
Mediapartner bot针对Adsense页面爬取内容
两者完全分来,Adsense的使用不影响网站排名,在Google内部,由两个部门来处理,但两者之间有互补作用,比如网页爬虫没有爬取到但Adnsese爬虫爬取到了会给予一个缓存。
3、确保搜索引擎爬虫在爬取页面的时候没有遇到SessionID和登录密码的干扰,SessionId被用来跟踪用户的网页行踪,但如果这些对搜索引擎爬虫造成妨碍,你的网站就没办法收录了。
4、确保网页服务器支持If-Modified-Since这样一个HTTP头部描述,它告诉Google爬虫在上一次爬取你网页以后,你网站的内容是否有更改过。
LYNX是一种飞虫小众的浏览器,能检查你的网站,LYNX忽略掉所有的CSS、JAVA、标签,只浏览网页代码里面的文字
EPSON LQ-635K打印三联发票相关问题
EPSON LQ-635K是税务局指定的针孔税控发票打印机,第一次打印三联发票,结果第一联打上去了,第二联第三联都没有复写上去,感觉是针头压力太小了,打开盖子,在色带右侧有一个调节色带松紧的开关,一般调到3-4比较适中,这样打印压力大小以及油墨消耗也不多。如果调节得太紧的话,就会造成针头压力太小,导致第二联第三联都没有复写上去的结果。
此外EPSON LQ-635K在外面买只要1600左右,而在税控器培训地点购买就要将近2400元!千万别买,东西完全一样,不要被斩了,此外买的时候也不要买所谓的央票,否则50元买来的纸连5元钱的成本也不知道有没。是的,这就是垄断企业靠着这种方式来赚取老百姓们的血汗钱。
你还在用IE浏览器吗?
评价浏览器主要指标是速度和安全性。IE的浏览器的安全性一直被人诟病,其实不是因为IE的安全性有多差,而是研究IE的用户数大,所以研究的人也多了。
这里主要比较的浏览器的速度,先介绍下一些基本概念,浏览器获取页面显示请求页面的HTML代码,然后分析HTML代码,获取页面的组件(CSS文件、JS文件、图片等)。当然无论获取HTML代码还是组件都可能需要进行DNS解析。
其次这些组件一般都是顺序下载的,比如一个CSS文件100KB,一个JS文件1KB,浏览器往往需要下载完CSS文件,再下载JS文件(前提是CSS文件出现在JS文件前),这样网页显示会很慢会一直等待那个100K的CSS文件下载完。当然目前浏览器都支持并发,这样就可以同时下载CSS文件和JS文件,在http1.1的协议中,IE5/6/7、firefox2最多支持2个并发数,IE8、firefox2最多支持6个并发数,opera和safari最多支持8个并发数,chrome最多支持4个并发数。
也许你会觉得并发数对于浏览器浏览网页的速度提高不是很明显,我们可以通过实际测试来说明问题,使用在线浏览器并发测试工具,地址:http://site-perf.com/
以http://www.sroan.com为例,分别使用2个并发数和6个并发数进行测试,结果如下:
2个并发数
6个并发数
通过对比可发现在相同条件下,6个并发数的浏览器比2个并发数的浏览器快了3.5秒,其中等待时间从71%下降到26%,这也是并发数度的好处(既在下载100K的CSS文件也同时可以下载1K的JS文件。)
当然这只是最肤浅得分析,如果要研究网站的性能就尽量使等待时间下降到0,通常合并JS、CSS等文件(同样100MB的1个文件进行复制速度肯定比100个1MB要快,因为IO读取写入耗时比传输大),同样网站为了负载均衡,将不同的文件放置于不同的域名机器下,这样导致了解析域名时间加长,反而影响加载速度。
最后引用一条等式:
全球IE用户×IE用户平均智商=全球chrome用户数×他们的平均智商+全球firefox用户数×他们的平均智商
你希望自己是在等号左边,还是在右边?
附chrome下载地:http://www.google.com/chrome


最近评论