浅谈网站的伪原创

现在越来越多的个人网站都使用采集其他网站内容来丰富自己网站,这还要归功于现如今CMS采集系统的强大。然而搜索引擎对于千篇一律的文章内容就极为反感,对于重复出现次数高的文章要么给予很低的权重与排位,要么就索性不收录。
于是在这样的大背景下,出现了所谓的伪原创。伪原创就是让原本搜索引擎已经认为千篇一律的文章重新翻新下,让搜索引擎认为这是篇新文章。这样搜索引擎又会高高兴兴去收录了,毕竟搜索引擎只是一个机器,改几个词,换个段落就不认识了。
常用的伪原创方法
1、更换标题
文章的标题好比文章的“姓名”,如果你名字都不换,怎么能让搜索引擎不认识你呢?标题最好换得彻底点,不要简单的几个词调换。否则搜索引擎一切词,"小丫,你一位你换了个马甲我就不认识你了吗?"
2、打乱段落
原本有5段段落的文章,你把第3段放到第1段,把第1段放到最后1段,第2段放到第4段……一个轮次下来,文章就面目全非了,搜索引擎已经不认识了。不过这个办法有个缺点,会使文章缺乏连贯性,甚至难以阅读。
3、关键词替换
这还得感谢中国文化的博大源深,一个词语可以有那么多同义词、近义词。你可以把“爸爸”换成父亲、老爸,还可以换个洋气点的名字DAD,挑几个出现频率高的关键词一换222,一篇文章又面目全非了。
4、增加删减部分内容
搜索引擎也是个没有耐心的家伙,他除了看你的名字(标题),最多检查下你穿了什么衣服,所有很多seoER在对文章伪原创时对文章的第一段进行适当的增加删减,最好的做法就是开头的第一段文章自己来写。这样搜索引擎发现第一段是如此第一无二后,也就90%认定你这篇文章是原创的了。

百度与谷歌对于伪原创收录的区别
相对于谷歌,百度对于网站的原创性要求很高,相信很多站长都遇到过这样的情况,谷歌的收录数量比百度的收录多很多,一方面是由于谷歌爬虫的确比百度强很多,更重要的是百度的算法已经删除了较多重复内容。
笔者某次去谷歌上海研究会总部参加会议,谷歌对于某些较难原创性的内容,如果网站结构分类、页面良好,还是会给予很高的权重。假设A网站内容都为原创,但分类混杂,然而B网站都是采集A网站内容,但是对于A网站的内容进行了很合理的分类,谷歌给予B网站的权重将远远超过A网站。

当然,无论给网站合理分类还是伪原创,只有做出真正属于自己的内容才是最好的网站优化方法。

低调回DC

一大清早躺在床上,在想昨天看的《蜗居》,是房子吃香呢?还是老男人吃香呢?应该是有房子的老男人最吃香!挣钱!买房!于是蹭地起床了。

早早地更新网站,以免又被网友碰盐汽水。

在忘记带通勤证的情况下,去了趟张江。天气回暖,呆子穿得真是青春啊,满脸的“青春”。

1点,交大帅哥准时出现在DC后门,堂堂的一博士,穿得跟机修工一样。XZL看到他,满怀关切地问:你怎么了?怎么看上去像30多岁?

XZL现在当班主任,教高三了。也终于解释我心中的疑问:维萨这学期他工资涨了1000多……

XZL满怀期待问我能不能帮他解决办公室里打网游的问题。我稍许皱了皱眉头。

XZL说他45岁绝对要退休,还有差不多7年,问我到时候清洁工要不要?4千-5千就可以了。难道那时候清洁工都是这个工资水平?……

XZL问我5大贪污的事情,结论是我以后也会么么黑的……

今天DC校运会,周四校庆,真是开心啊。

篮球场上转了圈,JL比样还是这么威猛,害我穿着牛仔裤+板鞋陪他打了这么久,吾真是罪孽啊,没人传球给我,球也投不进。

一场球下来,我手机里都是未接来电。现在10个电话9个是问:徐先生你好,从财务会计到3G上网,从高尔夫培训到军工产品买卖……接陌生电话已经有一套路了。

快三秒的老板依旧这么热情,江龙摸出了一张老人头,请我(早知道我就选最贵的了……)老板娘:“你变了好多,我都认不出来了”我笑笑,内牛满面。

从小姑娘侃到出国,从考研侃到小姑娘,从小姑娘侃到找工作,最后还是小姑娘……

4:00PM 散场

麻雀有属于麻雀的天空,鹰有属于鹰的天空,彼此没有什么羡慕,因为交换了位置彼此都不适应,在属于自己的天空飞翔遨游才会觉得快乐有意义。

C++文件复制

方法一:逐个字符复制

#include < fstream >

std::ifstream input("in",ios::binary);
std::ofstream output("out",ios::binary);
char ch;

while (input.get(ch)) output < < ch;

注意:如果使用input>>ch读取字符,则必须先调用input.unsetf(ios::skipws)取消输入流默认的跳过空白符的输入格式,因为换行符是空白符的一种。(BEN注:流失操作以空白字符'/0'为字符串的分割,并忽略它们,直接操作会缺失这些空白字符)

方法二:逐行复制

#include < fstream >
#include < string >

std::ifstream input("in",ios::binary);
std::ofstream output("out",ios::binary);
std::string line;

while (getline(input,line)) output < < line << "\n";

注意:这里的代码有一个小小的缺陷,如果文件不是纯文本格式的文件,或者文本文件的最后没有换行符,那么会导致复制后的文件末尾添加了一个多余的换行符。(BEN注:可以使用.gcount ()来判断是否到达文件尾,到达则不添加多余的'\n')

方法三:迭代器复制

#include < fstream >
#include < iterator >
#include < algorithm >

std::ifstream input("in",ios::binary);
std::ofstream output("out",ios::binary);
input.unsetf(ios::skipws);

copy(istream_iterator(input),istream_iterator(),ostream_iterator(output,""));

同样这里也有一个小技巧,输入流的格式默认为跳过空白字符,因此调用unsetf取消这个格式,才可保证正确的复制。

方法四:缓冲区复制

#include < fstream >

std::ifstream input("in",ios::binary);
std::ofstream output("out",ios::binary);

output << input.rdbuf();

这里直接使用了输入流的缓冲区,因此没有引入额外的临时对象。(BEN注:不管哪种方式操作,最好都使用缓冲提高效率,比如,可以使用字符串存储文件内容,再一次性写入到新文件,这样可以减少对文件的操作,因为对文件存储器的操作也就是I/O设备相对于内存是极其缓慢的)

很显然,上述四种方法中,最后一种方法最简洁,由于直接操作输入流的缓冲区,从运行效率上来说,也比其他方法有着略微的优势(当然,由于操作系统可能提供了额外的基于设备的文件缓冲机制,也许你无法证实这一点)。因此,除非要对输入内容进行处理,直接复制文件推荐最后一种方法,既不容易出错,又能获得良好的性能。

Before 2012

地球的北半球刚刚送走了近136年最短的秋天,地球的南半球却迎来100多年温度最高的11月份。

新买的衬衫还未穿上就已经畏缩在黑色风衣之中,没有温度的双手双脚不停地颤抖着,对着北风随口吐了三个字:狼色特了

有一匹马,不远千里迢迢,越过太平洋,在上海留下一句侬好。于是中美股市像打了鸡血一样地大涨,即使在雨雪天气受灾严重的情况下,股市依旧表现强劲,这个就是中国特色。

被封的外滩不知道让多少游客失望,否则也带那匹马去溜一圈。外滩整整修了一年多了,只是当年破乱的外滩遇上了一个失意的人。

幸好去年的今天没有这么冷,冻得鸡毛菜可以翻倍,不知道玫瑰的价格是否也会翻倍?起码店员会在玫瑰里少放点水,结冰就不好了,也就不会弄湿乘客的座位了。

很久没回学校了,据说最近学校的曝光率都赶上明星闹绯闻了。床上的席子会不会让宿舍显得格格不入?毕竟堆完雪人再看这个会让人神志不清。即使去年的今晚,空荡的床上放的是没有叠好的被子。

很想回忆起GWT那天说了什么?可惜自己删得太彻底,什么都记不起来了,只记得我在JAVA老师布置期末考试范围的时候毅然走出教室——翘课。(SORRY)

学妹说我写的文章包罗万象,那我稍微把时间拉得近点。

2012年前赚到10亿欧元看来是很不切实际的。不过在此之前学会开车,找个会开飞机的朋友还是很可能的。学会游泳,多听广播。不一定只有毕加索、梵高才能活下来。纵然我不相信玛雅人的预言,还是有一丝期待见证这么一个时刻。或许我也会拿着无线电跑去山顶上。

2012年前起码还有一届世界杯,说不定能够见证西班牙第一次夺冠。

地球毁灭了也没什么可怕的,党和国家会帮助大家重新建设家园的。只是我听到了一片笑声,于是难得一部大片没有删除任何情节。

这是一个神奇的国度,会在冰天雪地里救助陌生人,然后举着枪对你说,欢迎来到PRC。

中国的确是世界的工厂,我们造不出航空母舰,但能造诺亚方舟。

10岁的JACK看完电影后对妈妈说,喇嘛真是好人会救我们外国人,于是萨科奇笑了。

其实我不想剧透的,但只有这样才能把沙发留下。

在2012之前,什么都还来得及。

煮过的咖啡,香味溢满整个房间。

2009年最有才的15句话

1.只要功夫深,一日夫妻百日恩。——据说是某相声里的词儿

  2.没有拆不散的夫妻,只有不努力的小三。1.漫漫人生路,总会错几步。

  3.贫僧是自东土大唐而来,专程去往西天拜佛求亲的。

  4.三分天注定,七分靠打扮。

  6.将客户睡服。

  7.“回床率”,好词儿。

  8.我先脱了,您随意。

  9.公司的无耻程度总是超出员工的想象。

  10.挣的是卖白菜的钱,操的是卖白粉的心。

  11.早晨在路上见一车,车后贴一标,标上一句话:驾校除名,自学成才。

  12.琴棋书画不会,洗衣做饭嫌累。拒绝生儿育女,上床按次收费。——新时代女性宣言

  13.任何一个消息在经过官方否认之前都不能相信。

  14.贵国有风险,投胎须谨慎。

  15.你有权保持不沉默,但我们很快会让你沉默 下载RealPlayer来自:# 为了你的电脑安全,请只打开来源可靠的网址。打开网址 取消

乘错车

如果不是因为乘错车,展博就不会遇见宛瑜。

如果不是因为乘错车,就不会看见原本看不到的风景,遇见原本根本不会遇见的人。

最近没有坐错车,也没有想以此来一个深刻的隐喻。

相见、相识、重逢,在失去了原始的冲动后,才发现原来谁都不是无可替代的。

浩瀚的森林,向左走,将错过右边的红玫瑰,向右走,将错过左边的白玫瑰。而原地不走,是否就一无所有?

千域千寻是一种感觉,

千域千寻是一种希望,

所谓人生,所谓追求,我不相信努力一定会有结果,我相信运气、相信偶然。

看惯人性的丑陋,学会了给自己留下后路。

与其奢望别人的援助,无可替代的只有自己。

前方是末路,希望在转角。

2009 迷茫

中国足球经典语录

中国足球就是一个荷尔蒙分泌不正常的男人!

  畸形的、低迷的、甚至是诡异的中国足球最搞的一件事就是:无论一支烂到什么样的球队夺得所谓的中超冠军后都能拿到一笔丰厚的奖金,我完全不能理解。

  一个联赛的假赌黑现象出现后,“不靠谱”就成了这个联赛的代名词,观众觉得被戏弄了,一个戏弄人的联赛注定失去向心力和吸引力。说得难听一点,观众是被这样的比赛******************了。

  如果中国足球叫足球,那欧洲顶级联赛就不叫足球;如果人家叫足球,我们的就不能叫足球。两者根本就不是一个玩意儿。

  我觉得中国足球就是一出泡沫横飞的“肥皂剧”,尽是烟雾。本来就让观众雾里看花了,让那些对足球已了无心情的球迷失望了,而中国足球还在自娱自乐。

  ——韩乔生

  

万恶的rel= no follow

rel= no follow 使用Nofollow属性让搜索引擎不要抓取并追踪此链接。
网上都说google都认这个属性,不过测试下来即使使用了rel= no follow 还是传递了PR,结果本人的一个站点因此PR从4降到了3。哎,小人之心还是不能有,还是不用的好啊!

Google让我震惊!

今天受邀去Google中国上海研究院参加AdSense发布商见面会。比起上次大规模会议,这次人很少很少,只有10来个,admanager说这次特地控制人数,方便近距离接触。

莱福士16F,貌似很不起眼,左右对称的两个google接待室告诉每个来访者,这里就是google研究院。进门前,还要电子登记,得到一张粘纸贴在身上,MS用来证明身份的。

一进google大门除了GOOGLE的LOGO,最吸引人眼球的是每个办公室的名字,外滩、十六铺、周庄、火星、水星……Account manager说,平时大家都说去火星开会,你把东西放到周庄去。

先来说说我那16RMB是怎么得来的,会议之前,Manager说要让大家先认识认识,做一个团队游戏。(话说前不久去参加中国移动OPhone的会议,那个简直是枯燥,让我想起当年张健讲授网络程序设计,尤其是J2EE那章,太相似的感觉了!)游戏规则是这样的,每个人手上有20张贴条,写上自己的名字以及送给对方的金额,双方相互赠送的金额加起来必须等于2元,而且不能平分,就是说不能互送1元。

只能是 A 0.25 B 1.75

A 0.50 B 1.50

A 0.75 B 1.25

A 1.25 B 0.75

A 1.50 B 0.50

A 1.75 B 0.25

可能我“脸皮比较厚”,很不巧地以16元的成绩拿了冠军,(特别感谢那两位给我1.75元的MM - -!)。关键别人边玩这个游戏还发名片(这个游戏有时间限制),我就在那收收名片。

后来的内容就是从经济衰退讲到经济复苏,从CPT讲到CPA,从300*250讲到728*90,从春季讲到冬季,从窄屏讲到宽屏。会议中会突然从隔壁办公室会传来阵阵的笑声。

会议最后开到晚上5:45,对于这个时间又是周末,相信很多公司早就人去楼空了,在Account manager的带领下,参观了整个研究院,豪华的休息室,各个办公室依旧人头攒动,丝毫看不出下班的迹象。

或许这就是一个企业的文化吧,Google的确让我震惊!因为这个地方会让你不知不觉地爱上他,提示板上写的除了工作内容外,更多的是一种人性的体现。我已经不记得那些英文是怎么说的,大概记得中文意识。

不要轻易改变属于自己的工作方式。

告诉别人,再多给我一点时间,我一点能够完成。

尊重别人的工作方式,但能够使自己的工作方式影响到别人。

(style我姑且翻译成工作方式)

临走的时候,有人终于问了句,你们几点下班?admanager回答:六点,不过比较自由。突然想起佩奇曾经说过,我们起得比较晚,但工作得也比较晚。

Package name must have at least two identifiers.

Package name must have at least two identifiers.
这个是Package命名错误,com.domain.your_package_name 需要这样命名