unreadテーブルにchannel_idカラムを追加 #1746

logica0419 · 2023-04-05T16:25:01Z

resolve #1437 ?

#1737 にて、同条件でのクエリ実行時間が0.09秒→5秒となったことを受けて。
現在のテーブル構造ではどうクエリを効率化しても0.9秒程度になってしまい、前から言われていたレイテンシの問題が深刻化することが予想されるため、なんとかしようとした

正規化から遠ざかってしまうが、JOINが無くなるので大幅な時間短縮が見込める
不安点
- これでクエリ実行時間がどうなるかは、デプロイしてみないとわからない
- created_atを一意とみなしていいか大変悩みどころ

ryoha000

大体よさそう

model/messages.go

hijiki51 · 2023-04-07T02:49:21Z

@logica0419

これ現状のデータでcreated_atが一意に定まるかどうかは確認しました？（正月とか毎朝07:00とか発生してもおかしくはない）
- ↑複合だからそうそうないわ
- (注)負荷がかかるのでバックアップデータから手元で行うように
primary keyにcreated_atを指定すると一般に得られる情報（ID）から一意に検索することが困難になりますがそこはどう考えていますか？

ちょっと今忙しいので代案についてはあとで考えます

logica0419 · 2023-04-07T03:06:51Z

上のに関しては、今後保証できないこともあって、昨日message_idをprimary indexの末尾につけるコミットをしました
下のに関しては、現状議論の対象となるクエリとuser_id & channel_idでの検索しかunreadsテーブルを使うものが存在しない + foreign key constraintでchannel_idとmessage_idにindexが貼られるのでそこまで問題無いと考えています

hijiki51 · 2023-04-07T04:01:07Z

なるほど、ありがとうございます。

僕もゆがんだデータ構造に対して忌避感を持っていて、その理由としてはメンテナンスコストがかなり増大するからです。

特に今回の場合、PRIMARY KEYが通常用いられる"一意に特定するためのキー"でなく"ソートするためのキー"(created_at)として用いられているのが僕の忌避間の原因だと考えています。

メンテナンスコストの面でいうと、PRIMARY KEYにcreated_atが存在するのが今回の場合ある種非自明で、今後（ほかの人が）この周辺の処理をいじる際に毎回このPRの経緯を見て理解する必要が出てくる（もしくはSQLを見て必要性を理解する）コストが発生するのが懸念点だと感じています。

ここに関しては速度とコストのトレードオフなのでどちらを取るかはお任せします。

僕の意見としては、数ms程度の遅延なら許容かなと考えています

補足：

PRIMARY KEYが通常用いられる"一意に特定するためのキー"でなく"ソートするためのキー"(created_at)

時系列データなど時間そのものがPRIMARYな属性を持っているような連続データな場合はその限りではないですが、今回はそうではないとの認識です

hijiki51 · 2023-04-07T04:08:08Z

なんかちゃんと書いたら激怖文章になっちゃった、言葉固すぎ？

logica0419 · 2023-04-07T04:16:45Z

いや、僕は慣れてるからいいよ

今までこの「気持ち悪さ」・「忌避感」が感覚でしか話されてなかったから、メンテナンスコストの話は納得感ありました、ありがとう
確かにprimary keyの意義が変わって理解しづらいのは一理ある
コメント書けば解決する部分はちょっとあるかもしれないけども根本解決にはならないし

2人から異論が唱えられたのもあって、だいぶ迷ってますねぇ

hijiki51 · 2023-04-07T08:19:33Z

		SELECT 
			m.channel_id AS channel_id, 
			COUNT(m.id) AS count, 
			MAX(u.noticeable) AS noticeable, 
			MIN(m.created_at) AS since, 
			MAX(m.created_at) AS updated_at, 
			(
				SELECT message_id 
				FROM unreads u2 
				JOIN messages m2 ON u2.message_id = m2.id 
				WHERE u2.user_id = ? AND m2.channel_id = m.channel_id 
				ORDER BY m2.created_at ASC 
				LIMIT 1
			) AS oldest_message_id 
		FROM unreads u 
		JOIN messages m ON u.message_id = m.id 
		WHERE u.user_id = ? 
		GROUP BY m.channel_id;

これ内側から実行されるからGROUP_BYの前にサブクエリが実行されて、結果として全行に対してクエリが発行されるから遅くなってるのであって、分割したら早くなりそう

hijiki51 · 2023-04-07T08:20:56Z

いやSelectのほうが後だから、GROUP_BYはかかってるのか？

hijiki51 · 2023-04-07T08:23:14Z

サブクエリのm2.channel_id = m.channel_idがどうなるかで結構結果が変わる気がする

SQL筋不足です

logica0419 · 2023-04-07T10:10:29Z

		SELECT 
			m.channel_id AS channel_id, 
			COUNT(m.id) AS count, 
			MAX(u.noticeable) AS noticeable, 
			MIN(m.created_at) AS since, 
			MAX(m.created_at) AS updated_at, 
			(
				SELECT message_id 
				FROM unreads u2
				WHERE user_id = ? AND created_at = MIN(u.created_at)
			) AS oldest_message_id 
		FROM unreads u 
		JOIN messages m ON u.message_id = m.id 
		WHERE u.user_id = ? 
		GROUP BY m.channel_id;

一応これで、今のmasterのコードの1/5の実行時間にはなりました
(このPRを出す前にうにゃうにゃした結果)

hijiki51 · 2023-04-07T11:08:09Z

結構気になってるのはそのサブクエリ、GROUP_BYされた各行に対して実行されてる気がするから（最適化かかったらどうなるか知らないから曖昧なことしか言えない）
サブクエリじゃなくて分割してWINDOW関数にしたほうがいい気がする

hijiki51 · 2023-04-07T11:22:36Z

早いのか動くのかもわからんけどとりあえず

JOINする行数を減らす（message tableがでかいので）
クエリ発行回数を減らす

SELECT 
    m.channel_id AS channel_id, 
    COUNT(m.id) AS count, 
    MAX(u.noticeable) AS noticeable, 
    MIN(m.created_at) AS since, 
    MAX(m.created_at) AS updated_at 
FROM (
    SELECT * FROM unreads WHERE unreads.user_id = ? 
) AS u
JOIN messages m ON u.message_id = m.id 
GROUP BY m.channel_id;

SELECT t.message_id, t.channel_id, t.created_at, ROW_NUMBER() OVER (PARTITION BY t.channel_id ORDER BY t.created_at ASC) AS row_num
FROM (
    SELECT u.channel_id AS channel_id, u.message_id AS message_id, m.created_at AS created_at FROM (
        SELECT * FROM unreads WHERE u.user_id = ? 
    ) AS u
    JOIN messages m ON u.message_id = m.id 
    WHERE m.channel_id IN (?)
) AS t
WHERE row_num=1;

hijiki51 · 2023-04-07T14:17:44Z

WINDOW関数8.0空だったわ

hijiki51 · 2023-04-07T14:33:39Z

でも普通に分割したほうがいいと思います

hijiki51 · 2023-04-07T14:34:24Z

あとこれchannel_id単体にindexついてないけど大丈夫だっけ

hijiki51 · 2023-04-07T14:40:42Z

pikachuくんのでもサブクエリ別にすれば普通に早くなると思います

hijiki51 · 2023-04-07T14:56:09Z

一クエリならサブクエリとメインクエリ入れ替えるとサブクエリ発行回数が一回になって早くなると思うけど普通に読みにくいし別呼び出しがいいと思う

logica0419 · 2023-05-10T20:28:15Z

メモ: 現時点でマイグレーションは手元45分

余分になった未読を削除するように

logica0419 · 2023-05-11T17:13:13Z

メモ: 現時点でマイグレーションは手元15分弱

motoki317

いくつか

repository/gorm/channel.go

repository/gorm/message.go

migration/v33.go

docs/dbSchema/messages_stamps.md

This reverts commit f038c8e.

migration/v33.go

motoki317

Migrationの動作確認が取れていればよさそう

logica0419 added the kind/performance パフォーマンスの問題に関するもの label Apr 5, 2023

logica0419 requested a review from motoki317 April 5, 2023 16:25

ryoha000 reviewed Apr 5, 2023

View reviewed changes

model/messages.go Show resolved Hide resolved

logica0419 force-pushed the add-chan-id-to-unread branch from 9a161ea to 6db39b4 Compare April 21, 2023 18:44

logica0419 added 6 commits May 11, 2023 01:13

add channelID to Unread model

8006278

register dump file to ignore list

c83a230

fix unread query

244cb7c

improved query

f5d935a

added comments

fe60d38

v32 -> v33

b631c9d

logica0419 force-pushed the add-chan-id-to-unread branch from af677d9 to b631c9d Compare May 10, 2023 16:16

logica0419 added 3 commits May 11, 2023 01:38

add comments

f3a097f

fix comment

018c10d

fix MODIFY COLUMN query

7c7d6b5

logica0419 added 5 commits May 11, 2023 13:17

implement unreads deletion in ArchiveChannels

f038c8e

implemented unreads deletion in user deactivation

e32ad9b

added unreads deletion in migration

f89f14c

using sub query statement in Gorm & fix query

ac9f50c

Merge pull request #1802 from traPtitech/delete-redundant-unreads

009f2d4

余分になった未読を削除するように

logica0419 added 3 commits May 12, 2023 02:21

updated db schema

0239225

update comment setting

abd7787

removing dist folder with tbls option

453f74d

logica0419 mentioned this pull request May 11, 2023

TBLSをアップデート #1805

Merged

motoki317 reviewed May 11, 2023

View reviewed changes

repository/gorm/channel.go Outdated Show resolved Hide resolved

repository/gorm/message.go Outdated Show resolved Hide resolved

migration/v33.go Outdated Show resolved Hide resolved

docs/dbSchema/messages_stamps.md Show resolved Hide resolved

logica0419 added 4 commits May 12, 2023 07:35

Revert "implement unreads deletion in ArchiveChannels"

1cbe873

This reverts commit f038c8e.

not deleting unreads in archived channels

e29d2b4

using gorm-like expression

01fbf02

don't depend on model package

e235a6d

logica0419 requested a review from motoki317 May 12, 2023 01:55

motoki317 reviewed May 12, 2023

View reviewed changes

migration/v33.go Outdated Show resolved Hide resolved

motoki317 previously approved these changes May 12, 2023

View reviewed changes

deleted redundant query

8646a27

logica0419 dismissed motoki317’s stale review via 8646a27 May 12, 2023 03:12

logica0419 merged commit dda8a0b into master May 12, 2023
5 checks passed

logica0419 deleted the add-chan-id-to-unread branch May 12, 2023 16:08

logica0419 mentioned this pull request May 17, 2023

unreadsテーブルのcreated_atを修正 #1811

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

unreadテーブルにchannel_idカラムを追加 #1746

unreadテーブルにchannel_idカラムを追加 #1746

logica0419 commented Apr 5, 2023 •

edited

ryoha000 left a comment

hijiki51 commented Apr 7, 2023 •

edited

logica0419 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023

logica0419 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023

hijiki51 commented Apr 7, 2023 •

edited

logica0419 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023

hijiki51 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023

hijiki51 commented Apr 7, 2023

hijiki51 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023

logica0419 commented May 10, 2023

logica0419 commented May 11, 2023

motoki317 left a comment

motoki317 left a comment

unreadテーブルにchannel_idカラムを追加 #1746

unreadテーブルにchannel_idカラムを追加 #1746

Conversation

logica0419 commented Apr 5, 2023 • edited

ryoha000 left a comment

Choose a reason for hiding this comment

hijiki51 commented Apr 7, 2023 • edited

logica0419 commented Apr 7, 2023 • edited

hijiki51 commented Apr 7, 2023 • edited

hijiki51 commented Apr 7, 2023

logica0419 commented Apr 7, 2023 • edited

hijiki51 commented Apr 7, 2023 • edited

hijiki51 commented Apr 7, 2023

hijiki51 commented Apr 7, 2023 • edited

logica0419 commented Apr 7, 2023 • edited

hijiki51 commented Apr 7, 2023 • edited

hijiki51 commented Apr 7, 2023

hijiki51 commented Apr 7, 2023 • edited

hijiki51 commented Apr 7, 2023

hijiki51 commented Apr 7, 2023

hijiki51 commented Apr 7, 2023 • edited

hijiki51 commented Apr 7, 2023

logica0419 commented May 10, 2023

logica0419 commented May 11, 2023

motoki317 left a comment

Choose a reason for hiding this comment

motoki317 left a comment

Choose a reason for hiding this comment

logica0419 commented Apr 5, 2023 •

edited

hijiki51 commented Apr 7, 2023 •

edited

logica0419 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023 •

edited

logica0419 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023 •

edited

logica0419 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023 •

edited

hijiki51 commented Apr 7, 2023 •

edited