クラスターとは人の集まりや群れ、集団などのことです。ここではクラスターの定義から職場での対策、データ解析におけるクラスター分析について解説します。
目次
1.クラスター(cluster)とは?
クラスター(cluster)とは、ある疾患が特定の集団内に一定数みられる状態、あるいはその集団のことを指します。3密(密接空間、密集場所、密接場面)を避けることがクラスター発生の防止につながります。もともと花やブドウなどの房を指す言葉で、ここから転じて群れや集団、塊という意味で使われるようになりました。
クラスターは化学やITなどさまざまな分野で使われています。化学では原子や分子が結合してひとつの塊となっている状態を、ITでは複数のコンピューターをひとつのシステムに統合させることを指してクラスターと呼んでいるのです。
2.クラスターの定義
新型コロナウイルスの拡大により注目されるようになった「クラスター」は、小規模な集団感染、あるいはそれらによって形成された感染者の集団を指しています。疫学ではDiseaseclusterとも呼ばれているのです。
何人からクラスターと呼ぶか
厚生労働省はクラスターの目安を「1か所で5人以上発生し、接触歴が明らかである場合」としていますが、公式な定義はありません。
1施設で5人程度の陽性者が判明した場合をクラスターとする自治体や、仮に多人数でも感染の範囲が同居する家族にとどまる場合、「家庭内感染」とする自治体もあります。なおクラスター内の感染者数が50人を超えた場合、「メガクラスター」になるのです。
発生しやすい場所
厚生労働省が2021年4月づけで報告した「新型コロナウイルス感染症対策アドバイザリーボード」では、クラスターが発生しやすい場所として職場や学校などの施設が挙げられています。
職場における2021年1月のクラスター発生数は約11%でしたが、2月には約13%、3月には約18%と増加。学校や教育施設のクラスターも同様です。2月の約7%が3月には約10%、4月には約13%と増加しています。
これに対して高齢者福祉施設や医療機関のクラスター数は減少傾向にあるのです。1月の高齢者福祉施設では約37%でしたが、4月には約19%にまで減少しています。
3.職場におけるクラスター対策
新型コロナウイルス感染防止の対策はできていても、クラスター対策まではしていないという企業もあるでしょう。職場でクラスターが発生したとき、企業はどうしたらよいのでしょうか。5つの対策について解説します。クラスター発生後の対応を決める
- 保健所との連絡窓口を決める
- 感染者の休業指示や賃金などを決める
- 社内の清掃と消毒を行う
- 補助金や助成金について調べておく
①クラスター発生後の対応を決める
まずは職場内でクラスターが発生した際に企業としてどのような対応を取るべきか、手順を大まかに決めておきます。
- クラスター発生時の報告先
- 二次感染を抑えるための接触者リスト作成担当者
- 欠勤者の業務をカバーするための資料共有
- 就業環境(リモートワークやフレックス、休業など)の整備
これらをあらかじめ定めて社内で共有できていれば、社内でクラスターが発生してもスムーズに対応できます。
②保健所との連絡窓口を決める
クラスター発生時に備えて、あらかじめ保健所と会社の連絡窓口を決めておきます。クラスターが発生した際は保健所や医療機関、自治体や取引先への報告と連携が重要です。担当者は保健所の調査に応じるため、以下の情報を整理しておきましょう。
- 発症日
- クラスターが勤務した場所
- フロア図や座席などの感染者情報
- 取引のあった業者
いずれもトラブルを防ぐため、感染者本人に個人情報取得や第三者提供の同意を得ておく必要があります。
③感染者の休業指示や賃金などを決める
クラスターが発生したら、会社は感染者に休業指示を出さなくてはなりません。また直接感染していなくても、濃厚接触者として経営者の判断で自宅待機を命じる場合、該当者に休業手当を支払う必要があります。
厚生労働省による「新型コロナウイルスに関するQ&A(企業の方向け)」では、休業指示について次のように記載しているので覚えておきましょう。
- 休業手当については労使間の合意が必要
- 休業期間中は一般的に平均賃金の6割以上を支払う必要がある
- 従業員が安心して休めるよう、支払賃金は満額が望ましい
- 雇用調整助成金が支給される可能性もある
④社内の清掃と消毒を行う
クラスターが発生すると、企業は保健所から事業所内を清掃、消毒するよう指示されます。ドアノブやテーブル、イスなどの共用部分、トイレのレバーや蛇口などの水回りなどを消毒しなければなりません。
自治体によっては専門の業者を紹介しているところもあります。あらかじめ地域の消毒業者を調べておくとよいでしょう。なお清掃や消毒にかかる費用は事業者の自己負担です。
保健所の指示によっては、事業所の一時閉鎖を検討する必要もあります。いずれにせよ保健所からの指導がない場合もあるため、能動的な対応が重要になるでしょう。
⑤補助金や助成金について調べておく
クラスター発生によって感染者を休業させた場合、雇用調整助成金の支払対象になる可能性もあります。新型コロナウイルス感染症にともなう特例措置の支給要件は、以下すべての要件を満たす事業主です。
新型コロナウイルス感染症の影響によって経営環境が悪化、事業活動が縮小している
1カ月間の売上高あるいは生産量などが前年同月に比べて5%以上減少している
労使間の協定にもとづいた休業指示を出したうえで休業手当を支払っている
4.クラスター分析とは?
大きな集団の中から似たもの同士を集めてグループ(クラスター)を作り、対象を分析する手法のこと。人間に限らず商品や地域、企業やイメージなどにも活用できるため、マーケティング現場や市場調査など幅広く用いられます。
クラスター分析では年齢や性別、在住地域など、分類基準がはっきりとわかっているものは指標にしません。価値観や意識など外的基準がはっきりしていないデータを分類するのが特徴です。
5.クラスター分析で何ができる?
クラスター分析では生活者の視点に立った分類が発見できます。たとえばスーパーの市場調査をクラスター分析すると、次のように分類できるのです。
- 商品種類ごとの分類
- 取引先との取引履歴にもとづいた分類
- 店舗取り扱い商品ごとの分類
- 顧客層特性ごとの分類
一般的な分析では性別や年代ごとの平均購入価格を提示できます。しかし販路拡大の鍵となるターゲット層の絞り出しや売上に貢献する層を特定するには不向きです。クラスター分析ならターゲット層を絞り出し、マーケットを分析して他社との差別化を図れます。
6.クラスター分析の種類
クラスター分析には下記の2種類があります。
- 階層的手法
- 非階層的手法
①階層的手法
似たデータ同士を組み合わせてまとまり(クラスター)を形成していく手法のこと。データ間の類似度を測定する方法はいくつかあります。もっとも有名なのが全体的にバランスのよい分類ができる「ウォード法」です。
「樹形図(デンドログラム)」と呼ばれるトーナメント表のような図で、散らばったデータをクラスターに併合していく過程を視覚化できます。クラスター数を事前に決めなくても樹形図を見れば判断しやすい一方、データ量が大きいと計算量が膨大になるのです。
②非階層的手法
事前にクラスター数を決めて分類していく手法のこと。階層的手法のデメリットを補うため、樹形図のような階層的な構造は持ちません、
あらかじめクラスター数を決めておくため、全サンプル間の距離を計算する「階層的手法」よりも計算数が少なく済みます。そのためデータ量の多いビッグデータを分析する際に適しているのです。
異なるクラスター間の違いを際立たせるのに適したこのアルゴリズムは、クラスター数をいくつに設定するかが重要になります。
一般的には「k-means法」を用いるのですが、この方法は最初の核(重心点)次第で結果が大きく変わってしまうため、安定した結果を得るのが難しいのです。
7.クラスター分析の注意点
クラスター分析はあくまでもデータを分類するための分析方法にすぎません。クラスター分析を実施する際は以下3点に注意しましょう。
- 分析をする前に目的や仮説を明確にする
- クラスター分析だけで判断しない
- 客観的な結果を得られるとは限らない
①分析をする前に目的や仮説を明確にする
まず分析の目的や仮説を明確にします。これらが曖昧なまま分析を進めても、コンピューターがある法則に則ってただデータを分類しただけになり、それ以上の価値は生まれません。
「クラスター分析したデータは何に役立てたいのか」「そのために何個のクラスターを作るのか」「どのような傾向でクラスターが分類されているのか」などを、明確にしておきましょう。
②クラスター分析だけで判断しない
クラスター分析は大きなデータ群を類似性で分類することに長けているものの、具体的な数値を読み取るのは苦手です。そのクラスターがどのような規則性や因果関係で形成されたかは、クラスターをさらに分析しなければなりません。
クラスター分析を行う際は回帰分析や相関分析などほかの分析方法と併用します。そして具体的な業務改善やマーケティングにつなげていくのです。
③客観的な結果を得られるとは限らない
非階層型手法には分析するユーザーの主観が入りやすいです。「この顧客層にはこういう傾向があるはずに違いない」「新製品をこんな顧客層に使ってもらいたい」などの主観が、クラスター数や基準値を決める際に影響する可能性もあります。
クラスター分析を行う際は「複数意見を取り入れた数値を設定する」「必ずしも客観的な結果になるとは限らない」点を意識しておきましょう。
8.クラスター分析の進め方
どのような流れでクラスター分析を進めればよいのでしょうか。ここではクラスター分析の進め方を3つのステップに分けて説明します。
- 階層的手法:個体数(サンプル数)が100以下、あらかじめクラスター数を考える必要がない、グループわけの過程を知りたい
- 非階層的手法:個体数(サンプル数)が300以上、あらかじめクラスター数を決めておきたい、分析過程を観測する必要はない
このほか、個体数(サンプル数)が100~300程度の場合は階層的手法と非階層的手法を併用することも効果的です。
- ユークリッド距離(直線距離):2点間の直線距離を指したもの
- マンハッタン距離(市街地距離):マンハッタンや京都のように、碁盤の目のような街を移動する時の距離を指したもの。最短距離はどこを通っても同じ
- ミンコフスキー距離:ユークリッド距離とマンハッタン距離を含んだ指標。離れた距離の重みを増やしたり減らしたりできる
- チェビシェフ距離:同次元の変数を正方形上に広げ、斜めも同じ距離と考える指標
いずれもデータの種類によって最適な方法を採用するのが重要です。
- 階層的手法:ウォード法(クラスターの各サンプルと核の距離を考慮して形成)、重心法(クラスターの核(重心)からの距離を基準に形成)、最短距離法(距離が近いものから形成)
- 非階層的手法:k-means法(クラスターと各データの距離を考慮して、最も距離の近いクラスターに割り当てる方法)、超体積法(データの集合を多面体と考え、体積が最小になるようにクラスターを分類していく方法)