包头网络推广的网站主要内容是JS生成的,对于用户访问,没有优化;然而,该网站对爬虫捕获进行了优化,并直接将图片二进制内容放入HTML,导致页面长度过长;然而,经过优化后,发现内容不包括在百度中。页面质量很好,针对爬虫进行了优化。为什么不包括内容?
SEO工程师分析:
1.网站对爬虫进行优化,将图片二进制内容直接放在html中,导致页面长度过长,网站页面长度达到164k;
2.整个站点SEO优化后将主体内容放在后面,但图片放在前面;
3.爬虫抓取内容后,页面内容过长被截断,抓取部分无法识别主要内容,导致页面被认定为短而不包括在内。
SEO工程师建议:
1.不建议使用js生成主要内容,比如js渲染错误,很可能导致页面内容读取错误,无法抓取页面;
2.对于爬虫爬行做优化,请将主要内容放在前方,避免抓取截断造成的内容抓取不完整。
3.对于爬虫爬取做SEO优化的站点,建议页面长度在128k以内,不要过长;
*免责声明:转载内容均来自于网络,如有异议请及时联系,本网将予以删除。