1
tabris17 2014-10-30 15:06:21 +08:00
HTML
|
3
xiaojj 2014-10-30 15:34:42 +08:00
kindeditor ueditor
|
4
txlty 2014-10-30 15:39:03 +08:00
这和php无关,所有网站保存方式都一样。
|
5
learnshare 2014-10-30 15:40:56 +08:00
HTML 和 CSS 保存成数据库的文本数据,图片保存到服务器
|
6
raincious 2014-10-30 15:42:01 +08:00
算你新手吧
用户输入的代码 -> 转换器(BBCode或者Markdown之类)得到HTML字符串 -> HTML存入数据库 用户访问内容时直接展示。 当然安全过滤是需要严密关注的内容。 |
7
ss098 2014-10-30 15:53:17 +08:00 via Android
尽管楼主看起来并不是富有经验的程序员,但是我只能做到将原理简化到这些。
我采用的爬取形式 因为爬取通常是在后端离线进行的,对时间要求不高。 将获取到的 HTML 的文章部分(先通过其他方式解析掉 HTML 获取内容)采用 Markdown 解析器将内容转换成 Markdown,这通常可以保存图片但无法处理视频等其他媒体内容,符合楼主的要求。 得到 Markdown 后便解析比较轻松,可以解析图片资源并下载到本地服务器,并将 Markdown 内容的图片链接替换为本地图片。 最后将 Markdown 转换为 HTML 存入数据库。 |