场景:
可以理解为:记录飞机飞行的轨迹,把经、纬度点,高度、速度、航向存入PostgreSQL
数据库,并在经纬度列建立 gist 索引。
数据量大概在 1 亿条左右。
想实现查询指定区域范围(圆形、矩形、多边形)内的轨迹。
测试:
随机在经度(-180°,180°),纬度(-90°,90°)的范围内生成 1 亿个坐标点,保留小数点后 5 位小数,并存入数据库,测试在指定的范围内的查询速度。
查询矩形区域32°*32°
的范围,查询出来的记录数约为 150 万条,用时 15 分钟左右。
问题:
geometry(Point)
,在该列上建立的gist索引。create index idx_gistable_jwd on gistable using gist(jwd);
,而且用\d gistable
查看表的描述的时候,能看到该索引。select count(*) from gistable as t where st_contains('POLYGON((0 0, 32 0, 32 32, 0 32, 0 0))', t.jwd);
PostgreSQL
的配置保持安装时的设置。 1
nuistzhou 4 天前 via iPhone
你的 Gist 是不是有问题呀?一亿条数据也不应该这么久啊。另外,单看返回条数呢?是不是大部分时间花在返回数据本身上了?
|
![]() |
2
beginor 4 天前 via Android
经纬度保存成空间数据类型 Geometry 然后再加索引试试,这样可以用上空间索引
|
3
liuguangxuan OP |
4
liuguangxuan OP @nuistzhou #1 如果单看返回条数的话,使用 select count(*),时间也差不太多。
|
5
iseki 4 天前 ![]() explain (analyze on, timing on)看看慢在哪呗
|
![]() |
6
beginor 4 天前 via Android ![]() @liuguangxuan 坐标字段声明坐标系,空间数据类型建议使用 SP-GiST 索引类型, 查询时的空间参数也使用相同的坐标系, 空间函数 st_contains 可以改为 st_intersect 或者 && 算符
|
![]() |
7
a90120411 4 天前
别查 Point ,查 Line 。
用点来生成线,在线对象数据中同时保存与点集合的业务数据关联。 |
![]() |
8
wd 4 天前 via iPhone
st_contains 走索引吗?好像不走?
|
9
v2eb 4 天前 via Android
分析突然减速的这种场景,好像和坐标没有必然的联系吧,还是没有速度这个数据条目?
|
10
nuistzhou 4 天前 via iPhone
1. explain 看看吧,前面的老哥提到了,看看是不是 hit 太多了
2. 试试 st_geohash 吧,可以把点聚集起来,然后建个空间索引,hit 应该会降低不少 3. 试试 @ 这个 operator |
11
liuguangxuan OP @beginor #6 老哥,我大概按你的方法测试了一下,分别测试了 st_contains 、st_intersects 、&&在不同索引( gist,sp-gist )下的查询情况,并且换了一台服务器。每次测试均重启了服务器。
总体而言,gist 索引性能好于 sp-gist 索引,首次查询 st_intersects 性能比较好,第二次查询&&性能比较好。 测试结果和老哥说的有点儿出入,能不能帮忙解答一下原因,还是我测试的方式不太对? ![]() |
![]() |
12
beginor 1 天前 via Android
SP-GiST 是带分区的 GiST ,至于谁比谁更好,要看具体场景和数据类型,实际上也差不了多少。
|
![]() |
13
dzdh 1 天前
完整 sql 方便贴一下吗
explain(timing, analyze, buffers) 或者是 explain 结果 |
14
liuguangxuan OP |