データ分析をしていると、「同じ名前のはずなのに別データとして認識されている…」という経験をしたことがある人は多いと思う。
その原因の多くは、文字列の前後に紛れ込んだ「空白(スペース)」である。
こうした不要な空白を一瞬で削除してくれる便利な関数が TRIM関数 だ。
実務でよく発生するデータの不整合を防ぐためにも、Tableauユーザーならぜひ理解しておきたい関数である。
文字列関数の中でこのTRIM関数と前回記事にしたSPLIT関数は個人的に実務でよく見るので、両方とも理解しておくとTableauでの活用の幅が広がるはずだ。
TRIM関数とは?
TRIM関数は文字列の「先頭と末尾の空白」を削除してくれる関数だ。
SPLIT関数やLEFT関数などと同じ文字列関数の1つに該当する。
例えば、サンプルスーパーストアの顧客名の先頭にスペースを入れたものを混ぜた例で、TRIM関数の機能を説明していこう。
下記の通り、本来同じ名前の人なのにスペースが入っているせいで、Tableau上で別データだと認識されてしまっている。
BtoC のデータでユーザーが直接入力したり、スタッフが手作業で入力するデータだと、こういうことが頻繁にある。
このデータにTRIM関数を使用する。
すると、先頭と末尾のスペース(空白)が削除される。
このようにTRIM関数は
- 「不要なスペースのせいでデータが分かれてしまっている、、、」
- 「不要なスペースのせいで文字列の比較や集計がうまくできない、、、」
という時に便利な関数だ。
「文字列の先頭や末尾に空白が見つからない場合は何もしない」ということも、併せて覚えておくといいと思う。
TRIM関数の使用方法
TRIM関数の使用方法は下記の通りだ。
使い方は他の関数に比べて非常にシンプルなので、使い方を間違えることはあまりないと思う。
ただ、TRIM関数の対象となるのは文字列のみである点だけは忘れないようにしたい。
具体例を確認しよう!
その結果、下記のように先頭や末尾にスペースが入っていたデータはTRIM関数によってスペースが除去される。
性と名の間のスペースはTRIM関数を使用しても残ったままなのがお分かりいただけると思う。
あくまでTRIM関数は「先頭と末尾のスペースを削除してくれる関数」なのだ。
LTRIM関数・RTRIM関数との違い
TRIM関数と似た関数で、LTRIM関数とRTRIM関数の2つがあるが、違いは下記の通りだ。
- LTRIM関数:先頭のスペース(空白)のみを削除する
- RTRIM関数:末尾のスペース(空白)のみを削除する
- TRIM関数:先頭と末尾のスペース(空白)どちらも削除する
LTRIM関数は文字列の左側(LEFT)=先頭のスペースのみを削除し、RTRIM関数は文字列の右側(RIGHT)=末尾のスペースのみを削除する。
それに対して、TRIM関数はLTRIM関数とRTRIM関数の機能を併せ持った関数で先頭と末尾のスペースをどちらも削除してくれる。
実務上はLTRIM関数やRTRIM関数をあまり見かけないが、データの特性に応じて使い分けるといいと思う。
まとめ
「不要なスペースの削除」というのはデータの加工・整形処理でよく使うので、今回扱ったTRIM関数はぜひ覚えておきたい関数だ。
- TRIM関数は文字列の先頭と末尾の空白を削除する関数
- 不要なスペースでデータが分かれてしまう問題を防げる
- LTRIM関数は先頭のみ、RTRIM関数は末尾のみのスペース削除
- TRIM関数はその両方をまとめて削除できる便利な関数
SPLIT関数やCONTAIN関数など、他の文字列関数と合わせて使用できるようになれば、かなり活用の幅が大きくなるはず!
関連する文字列関数は下記で紹介しているのでぜひ読んでみてほしい!