2024-12-22 02:07:05 | 来源: 互联网整理
■舆论场
1月22日
一篇名为《搜索引擎百度已死》的文章在网络刷屏。文章指出,百度首页搜索结果显示过半会指向百度自家产品,尤其是“百家号”,作者认为搜索内容质量大幅下滑,质疑百度作为搜索引擎的作用。
1月23日
成都商报-红星新闻记者分别联系当事双方。文章作者方可成,前《南方周末》记者,他说对这个现象关注许久,称写此稿初衷只希望普及信息质量的重要性。百度则就百家号内容占比回应“全站占比小于10%”。
1月23日
微博热搜也出现了“搜索引擎百度已死刷屏”的话题。截至1月23日下午4点,该话题阅读已突破1亿,讨论近万。
■资本场
据《证券时报》报道,1月22日早些时候,花旗将百度目标股价调低至205美元,列入负面观察名单;美国时间1月23日,百度收报163.26美元,总市值约570亿美元。
近日,自媒体“新闻实验室”一篇《搜索引擎百度已死》引发大量关注。
文章称,“你在第一页看到的搜索结果,基本上有一半以上会指向百度自家产品,尤其频繁出现的是‘百家号’。”
文章直指百度搜索引擎名存实亡,成为百家号的站内搜索,而百家号中充斥着的大量低质内容使百度的搜索结果难以满足用户需求。
对此,1月24日,成都商报-红星新闻记者进行了测试。记者分别在百度、搜狗、360搜索等搜索引擎以相同关键词条进行搜索,结果如下——
测试1
关键词条:
特朗普
自媒体“新闻实验室”:
在百度搜索“特朗普”,其第1页的结果分别是:百度百科、百度贴吧、百家号、百家号、百家号、百家号、新浪、百家号、百度百科。
1月24日,记者在百度搜索引擎搜索特朗普,首页显示的搜索结果为:特朗普的最新相关信息、百度百科、百度贴吧、百家号内容、百家号内容、百家号内容、百家号内容、百度百科、新浪科技网内容以及雨果网内容。相比《搜索引擎百度已死》的搜索“特朗普”的结果,有了一定变化。
而记者在搜狗搜索“特朗普”的关键词,首页显示的搜索结果来源分别为:搜狗百科、特朗普的最新相关信息、网易军事、百度贴吧、知乎相关问答、特朗普的图片、凤凰网、环球网、豆瓣电影、新浪网以及和讯新闻。
按数目来算的话,搜狗自己的产品仅占据搜索结果的2/11。无怪乎在舆论发酵后,搜狗CEO王小川在接受36氪采访时表示:“欢迎使用搜狗。”
记者在360搜索对关键词“特朗普”进行了搜索。其第一页显示的搜索结果来源分别为:360百科、特朗普的最新相关信息、新浪网、360图片、国际在线、新蓝网、亚马逊、百度贴吧、搜狐以及同花顺财经。
就这个结果来说,360搜索的产品仅占据其搜索页面搜素结果的3/10。
测试2
关键词条:
怎样写
毕业论文
自媒体“新闻实验室”:
在百度搜索“怎样写毕业论文”,其第1页的结果分别是:两条论文代写广告,然后是百家号、百家号、百家号,然后是两个论文代写网。其中,广告占据了2/7,百度的产品占据了首页搜索结果的4/7。
紧接着,记者又在百度、搜狗、360搜索等搜索引擎搜索了“怎样写毕业论文”。
在百度,第一页显示为:5条广告、百家号、百家号、乐众联创笔迹查重、百家号、论文代写、论文代写、学术参考网、知乎、怎样写论文视频大全、百度经验。广告占1/3,百度自家的产品占首页搜索结果的4/15。
在搜狗搜索,首页显示为:5条广告、百度经验、学术参考网、百度文库、论文服务网站、论文服务网站、搜狗微信、搜狗指南、百度经验、搜狗知识、搜狗指南、百度经验。搜狗搜索的产品占搜索结果的1/4。
在360搜索,第一页显示的搜索结果为:5条广告、360点睛、360新知、知乎、百度经验、万方数据知识服务平台、360问答、360百科、应届生求职网、百度知道、知乎、豆瓣。广告占据了5/16,360的产品占据了首页搜索结果的1/4。
测试3
关键词条:
人工智能
自媒体“新闻实验室”:
在百度搜索“人工智能”,其第1页的结果分别是:4条广告、百度百科、同花顺、人工智能实验室、爱范儿、百家号、百度百科、百家号、百度贴吧。其中,广告占据了1/3,百度的产品占据了首页搜索结果的5/12。
记者再度在百度搜索引擎搜索人工智能,首页显示的搜索结果为:5条广告、百度百科、同花顺、爱范儿、人工智能(豆瓣)、百家号、百家号、人工智能网、360个人图书馆、百度人工智能最新相关消息、百度贴吧。其中,广告占据了1/3,百度的产品占据了首页搜索结果的1/3。
接下来,记者在搜狗搜索对关键词“人工智能”进行了搜索。第一页显示的搜索结果来源分别为:1条广告、搜狗百科、人工智能网、爱奇艺、搜狗人工智能最新相关消息、知乎、容大教育、MBA智库百科、人工智能学习网、知乎、豆瓣、3条广告。其中,广告占据了4/15,搜狗的产品占据了首页搜索结果的2/15。
紧接着,记者在360搜索对关键词“人工智能”进行了搜索。第一页显示的搜索结果来源分别为:4条广告、360点睛、炼数成金、360百科、和讯财经新闻、爱奇艺、360有关人工智能图片、360咨询有关人工智能最新消息、中国网信网、亚马逊、人工智能学习网、人工智能网、爱奇艺、广告。其中,广告占据了5/17,360的产品占据了首页搜索结果的4/17。成都商报-红星新闻实习记者 杨佩雯 白兆鹏
【观察】
2019年谁能突围搜索引擎产业
随着《搜索引擎百度已死》文章内容不断发酵,网友争议颇多,“现在搜索点资讯真是心累,先用百度搜一次,再用头条、微信搜一次,不行还得用知乎、豆瓣搜一次。”网友@joey高表示,搜索开始变成一项成本越来越高的事情。
令人意外的是,记者发现在网友反馈意见中,开始习惯使用PC端360搜索以及今日头条、微信、知乎等平台进行搜索的用户不在少数。当前搜索引擎市场用户占比究竟如何?又有哪些新的竞争领域出现?
根据2018年11月艾媒咨询发布的《2018中国PC搜索市场专题报告》显示,中国PC搜索用户规模呈缓慢增长态势,2018年中国PC搜索用户达到6.88亿人,同比增长率较低,中国PC用户规模趋于饱和状态。
报告显示,中国PC搜索市场目前分为两个梯队,第一梯队为百度搜索,百度搜索进入市场较早,拥有较多用户人群,以强大的优势占据PC搜索市场第一梯队;第二梯队包括拥有较大流量入口的360搜索。其中百度搜索在中国PC搜索各平台中流量份额最高,占比达到56.0%;其次是360搜索和搜狗搜索,分别占比为35.2%和6.0%。
艾媒咨询分析师认为,随着PC搜索市场的饱和和百度口碑的下降,二三梯队产品背靠企业同样具有丰富的技术和流量资源,未来在垂直搜索、便捷学术搜索和商业搜索等方面表现突出的企业有望对百度形成更强的冲击。
有业内人士表示,满足用户的信息需求是搜索引擎的逻辑起点和最终归宿, 对于网络中各种类型和以各种存储方式存在的信息,用户其实并不了解,用户关注的重点是通过搜索工具查找到所需要的信息满足自身的信息需求。因此,未来PC搜索的发展要想扩充市场份额,只有紧跟用户需求精准定位用户搜索意图才是重点。
成都商报-红星新闻记者 杨程
小/结/
抛开自媒体新闻实验室1月22日发布的文章中的搜索数据,从上图可见,成都商报-红星新闻记者在百度、搜狗、360三个平台搜索之后得出的各平台自家产品占比,百度要高于另外两个平台。
这从一个侧面验证了自媒体“新闻实验室”的说法——一定程度上,百度成了自家的站内搜索。
有网友为此质疑,有私心的搜索引擎会是好的搜索引擎吗?
作者:msay
来源:https://www.cnblogs.com/mingjiatang/p/6048193.html
本文主要介绍如何通过Google的API来定义自己的搜索引擎,并将Google搜索框嵌入到自己的web页面。另外,分析了自定义搜索引擎请求数据的url,模拟请求并获取搜索的结果。
1 写在前面
前段时间发现了一个网站提供搜索百度网盘资源,挺好用的,但是广告很多,于是自己做了一个Winform窗体程序去获取该网站的数据请求,解析并绑定请求的结果
后面我发现提供网盘资源搜索的网站内部是利用google搜索引擎的api来完成的。在网上搜索了一些资料,捣鼓了google自定义搜索引擎的功能,发现确实挺好玩的。后面又有同仁问能不能介绍一下如何实现使用google搜索的api,那么下面就开始吧。
2 自定义搜索引擎
1)自定义google的搜索引擎,那首先得有一个google的账号呀,这也是第一步,先注册一个google的账号。
2)注册google的账号之后,进入自定搜索引擎的页面,https://cse.google.com/cse/,页面如下。
3)点击右侧的【新增搜索引擎】,填写你搜搜引擎的基本配置。页面如下。
我可以看到,只需要配置三项即可完成自定义搜索引擎。
4)点击创建,就实现了自己的搜索引擎,点击右侧的【修改搜索引擎】的页面,如下图。
在修改搜索引擎的页面中有一个【搜索引擎ID】,这个特别关键,你可以点击它,查看你这个搜索引擎的id编码,还可以公开你这个搜索引擎的网址。还有一个很重要的就是【获取代码】,获取这段代码就能够实现将自定义的搜索引擎框嵌入到你自己定义的web页面中,点击【获取代码】。能够获取到一段html代码,如下:
另外,在上面步骤4)的截图1中,可以测试一下,你自定义的搜索引擎。在这里,我们输入【数学】关键字,结果如下。
3 如何使用自定义搜索引擎
在第二小节中我们已经创建了属于我们的搜索引擎了,那么下面我们如何使用它。在这里,我采用两种方式,第一种方式直接将第二节中的代码拷贝出来,并嵌入到自己web页面中;第二种方式是分析自定义搜索引擎请求的url结构和请求方式,然后去构造搜索的url,模拟请求获取查询结果。
3.1 嵌入web页面
首先自定一个html页面,然后把第二节中讲到的代码拷贝到div中,代码如下。
注意:上面的var cx='搜索引擎ID,这个【搜索引擎ID】就是第二节创建自定义搜索引擎时自动生成的,将你创建的搜索引擎ID替换到这里即可。下面是页面效果。
这下就实现了将自定义搜索引擎嵌入到自己的web页面。
3.2 模拟请求
通过分析,搜索引擎搜索请求的url为:
url主要参数分析:
构造上面这种模式的url,采用GET的方式去请求,会得到如下返回的json数据,json数据包含了搜索结果以及附带属性(搜索结果总数等)。如下图所示。
明白了引擎请求搜索结果的这一流程,那么用c#语言来实现就非常简单了。代码非常简单,就不贴出来。
4 总结
使用google的api自定义搜索引擎最最关键的一点就是,你的机器要能够访问google。要是不能访问google,那就只能/(ㄒoㄒ)/~~。本文举的例子是搜索百度网盘资源,当然你也可以搜索博客园的所有资源。
其实,google自定义搜索引擎api还有更加精彩设置,你可以去玩玩。
今天一起来了解下一些常见的搜索引擎。目前国内主流的5大搜索引擎有百度、谷歌、360、神马及搜狗搜索。1.用户通过百度搜索引擎可以搜到世界上zui新zui全的中文信息,它拥有全球zui大的中文网页库。同时,百度在中国各地分布的服务器能直接从zui近的服务器上把所搜索的信息返回给当地用户,使用户享受快速的搜索传输速度。百度目前提供网页搜索、音乐搜索、图片搜索、百度新闻、百度贴吧、百度知道、百度新闻、百度百科等主要产品和服务,同时也提供多项满足用户更加细分需求的搜索服务,如地图搜索、黄页搜索、文档搜索、邮编搜索、政.府网站搜索、视.频搜索、百度翻译、百度识图、报读票务等服务;除了上述提到的搜索服务外,百度还在个人服务领域提供了包括百度影音、百度云、百度输入法等服务。
2. 神马搜索神马搜索是UC(优视)和阿里巴巴于2013年成立合资公司后推出的移动搜索引擎,2014年4月28日,UC正式宣布与阿里巴巴合作共同发布旗下移动搜索引擎品牌——神马搜索。
3. 360搜索国内搜索引擎市场份额中排在第三位的是360搜索,360搜索属于元搜索引擎,是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。它同时将信息聚合在一起实现网络工具化、个性化的发展需求,提升网络使用效率,让用户更快地从繁复的搜索系统里解放出来,让上网搜索更轻松有.效。360搜索主要包括新闻搜索、网页搜索、视.频搜索、MP3搜索、图片搜索、地图搜索、问答搜索、学术搜索等,通过互联网信息的及时获取和主动呈现,为广大用户提供实用和便利的搜索服务。
4. 搜狗搜索是搜狐公司于2004年8月3日推出的全球首.个第三代互动式中文搜索引擎。搜狗搜索致力于中文互联网信息的深.度挖掘,帮助中国上亿网民快速信息获取速度。搜狗搜索是全球首.个百亿规模中文搜索引擎,于2007年1月收录中文网页达百亿,再创全球中文网页收录量新高。其每日网页更新达5亿,用户可直接通过网页搜索而非新闻搜索,获得zui新新闻。
5. GoogleGoogle(谷歌)公司成立于1998年9月4日,由拉里·佩奇和谢尔盖·布林共同创建,被公认为全球zui大的搜索引擎。Google是一家位于美国的跨国科技企业,业务包括互联网搜索、云计算、广.告技术等,同时开发井提供大量基于互联网的产品与服务,其主要利润来自于AdWords等广.告服务。Google目前的主要业务有谷歌搜索、谷歌广.告、谷歌地图、谷歌火星、谷歌月球、YouTube、Android、Chrome、Google Play、Gm.ail等。