打算做一个免费的站内搜索 SAAS 服务 供各站长,静态博客免费使用 - V2EX
2019-07-31 23:25:24 Author: www.v2ex.com(查看原文) 阅读量:236 收藏

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。

网站自带的基于数据库的站内搜索不论效果还是效率都不如意,所以大战都自建搜索。

中小网站没有资源或能力自建搜索,所以打算开发一个 SAAS 模式的站内搜索,只需输入一个网址即可创建自己的搜索引擎。

百度其实也有站内搜索,不过我们后续还会提供一个自动标签云页面,自动从文章提取专有名词等形成标签云,提升网站内链。

暂时想到这么多。

各位有什么看法吗?

3

zhshch   1 天前

我前两天也想过类似的站内搜索服务,正好关注一下。没记错的话,swiftype 的中文支持一般。

4

ddup   1 天前

@zhshch #3 swiftype 试了下用是能用,不过收费 $79/月 挺贵的。

5

zhshch   1 天前

面向个人的静态博客的话,79 刀基本就不可接受了。但是静态博客的搜索需求有多大?那么这个服务的目标群体是谁呢?

6

hyyou2010   1 天前

用过一点 elasticsearch,真是太麻烦了,对网站本身影响太大,如果有这样的服务应该很不错。

7

ddup   1 天前

@zhshch #5 所有基于数据库搜索的网站、论坛的用户,都用这种需求,比如 Deepin 深度系统论坛,你在里面搜“ surface4 驱动”,搜不到,但是搜“ surface 4 驱动”则能搜到。

8

ddup   1 天前

@hyyou2010 #6 ES 对技术和服务器配置是有要求的,所以有一定门槛,部分站长只能将就用现有的搜索。

不过百度站内搜索也可以全站收录,所以也可以选择用百度站内搜索。

所以如果要做,就除了搜索还要有其它亮点出来,目前想到了自动生成标签云。

9

kopisee   1 天前 via Android   ♥ 1

以前 Swiftype 还有免费版的时候用过,可以自己在标签加入指定属性声明需要被抓取(即能被搜到)的部分。而不需要网站提交数据或引入插件。当然提交数据也可以,提交数据也不用改网页。

百度站内搜索就是一整页抓取了,全站通用的顶部、底部部分都能被搜到,跟理想的搜索结果不太符合。站内搜索希望主要就是搜标题、内容。

10

iambin   1 天前

可以参考一下阿里云开放搜索.真要弄的话要弄 api 哟 ,不然就成玩具了

11

ddup   23 小时 54 分钟前 via Android

@kopisee 大体上和 swifttype 一样,不过网页内容是可以过滤掉头尾。

12

ddup   23 小时 50 分钟前 via Android

@iambin 嗯,阿里那个也是对个人来说贵,默认傻瓜化输入网址就可以了,api 后续考虑,能免得就尽量免费,然后靠搜索页面的广告收入可持续化发展。

13

iambin   3 小时 58 分钟前

个人站长? 小网站没有这种需求吧 还有广告 还不如用百度站内搜索,有需求的不是买就是自己弄了。你给我接口 不是太贵的话 我能玩出花来

14

ddup   1 小时 53 分钟前

@iambin #13 百度站内搜索已经做的不错了,所以要差异化,做百度站内搜索不太会做的事情。

目前想到两个:

# **从网站使用者角度考虑**
我会制作一个 Chrome 插件,按照这个插件后,浏览某个网站,比如深度论坛,发现搜索不好用,点击 Chrome 插件一键提交,系统自动索引这个网站,索引完成后通过 Chrome 插件替换掉这个网站原来的搜索。
此时好事情来了,别的用户再到深度论坛搜索时,就会通过我们的系统进行搜索了,这样这个插件就具有实用性,越来越多的用户会安装这个 Chrome 插件,我们的搜索也越来越多的人用,甚至我们自动全网收录流量比较大的网站。

那用户为什么要装我们的插件不直接用百度?
1.那你为什么要在这个网站上做站内搜索?
2.我们和百度、谷歌的区别是,我们是站内搜索,这个网站所有内容照单全收,这个网站上存在的内容都能搜到

# **SEO 方面**
自动从正文生成标签云,利于站内收录,后续可能还会自动生成聚合页面


文章来源: https://www.v2ex.com/t/587484#reply14
如有侵权请联系:admin#unsafe.sh