Skip to main content

2024 | OriginalPaper | Buchkapitel

Multivariate Beta Mixture Model: Probabilistic Clustering with Flexible Cluster Shapes

verfasst von : Yung-Peng Hsu, Hung-Hsuan Chen

Erschienen in: Advances in Knowledge Discovery and Data Mining

Verlag: Springer Nature Singapore

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

This paper introduces the multivariate beta mixture model (MBMM), a new probabilistic model for soft clustering. MBMM adapts to diverse cluster shapes because of the flexible probability density function of the multivariate beta distribution. We introduce the properties of MBMM, describe the parameter learning procedure, and present the experimental results, showing that MBMM fits diverse cluster shapes on synthetic and real datasets. The code is released anonymously at https://​github.​com/​hhchen1105/​mbmm/​.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Ankerst, M., Breunig, M.M., Kriegel, H.P., Sander, J.: OPTICS: ordering points to identify the clustering structure. ACM SIGMOD Rec. 28(2), 49–60 (1999)CrossRef Ankerst, M., Breunig, M.M., Kriegel, H.P., Sander, J.: OPTICS: ordering points to identify the clustering structure. ACM SIGMOD Rec. 28(2), 49–60 (1999)CrossRef
2.
Zurück zum Zitat Arnold, B.C., Ng, H.K.T.: Flexible bivariate beta distributions. J. Multivar. Anal. 102(8), 1194–1202 (2011)MathSciNetCrossRef Arnold, B.C., Ng, H.K.T.: Flexible bivariate beta distributions. J. Multivar. Anal. 102(8), 1194–1202 (2011)MathSciNetCrossRef
3.
Zurück zum Zitat Caruana, R., Elhawary, M., Nguyen, N., Smith, C.: Meta clustering. In: International Conference on Data Mining, pp. 107–118. IEEE (2006) Caruana, R., Elhawary, M., Nguyen, N., Smith, C.: Meta clustering. In: International Conference on Data Mining, pp. 107–118. IEEE (2006)
4.
Zurück zum Zitat Ester, M., Kriegel, H., Sander, J., Xu, X.: A density-based algorithm for discovering clusters in large spatial databases with noise. In: Simoudis, E., Han, J., Fayyad, U.M. (eds.) International Conference on Knowledge Discovery and Data Mining, pp. 226–231. AAAI Press (1996) Ester, M., Kriegel, H., Sander, J., Xu, X.: A density-based algorithm for discovering clusters in large spatial databases with noise. In: Simoudis, E., Han, J., Fayyad, U.M. (eds.) International Conference on Knowledge Discovery and Data Mining, pp. 226–231. AAAI Press (1996)
5.
Zurück zum Zitat Ji, Y., Wu, C., Liu, P., Wang, J., Coombes, K.R.: Applications of beta-mixture models in bioinformatics. Bioinformatics 21(9), 2118–2122 (2005)CrossRef Ji, Y., Wu, C., Liu, P., Wang, J., Coombes, K.R.: Applications of beta-mixture models in bioinformatics. Bioinformatics 21(9), 2118–2122 (2005)CrossRef
6.
Zurück zum Zitat Jones, M.: Multivariate t and beta distributions associated with the multivariate f distribution. Metrika 54(3), 215–231 (2002)MathSciNetCrossRef Jones, M.: Multivariate t and beta distributions associated with the multivariate f distribution. Metrika 54(3), 215–231 (2002)MathSciNetCrossRef
7.
Zurück zum Zitat Karami, A., Johansson, R.: Choosing dbscan parameters automatically using differential evolution. Int. J. Comput. Appl. 91(7), 1–11 (2014) Karami, A., Johansson, R.: Choosing dbscan parameters automatically using differential evolution. Int. J. Comput. Appl. 91(7), 1–11 (2014)
8.
Zurück zum Zitat Kleinberg, J.: An impossibility theorem for clustering. Adv. Neural Inf. Process. Syst. 15, 463–470 (2003) Kleinberg, J.: An impossibility theorem for clustering. Adv. Neural Inf. Process. Syst. 15, 463–470 (2003)
9.
Zurück zum Zitat Kotz, S., Balakrishnan, N., Johnson, N.L.: Continuous Multivariate Distributions, Volume 1: Models and Applications. John Wiley & Sons, Hoboken (2004) Kotz, S., Balakrishnan, N., Johnson, N.L.: Continuous Multivariate Distributions, Volume 1: Models and Applications. John Wiley & Sons, Hoboken (2004)
10.
Zurück zum Zitat Kraft, D.: A software package for sequential quadratic programming. Wiss. Berichtswesen d. DFVLR (1988) Kraft, D.: A software package for sequential quadratic programming. Wiss. Berichtswesen d. DFVLR (1988)
11.
Zurück zum Zitat Lien, C.Y., Bai, G.J., Chen, H.H.: Visited websites may reveal users’ demographic information and personality. In: International Conference on Web Intelligence, pp. 248–252. IEEE (2019) Lien, C.Y., Bai, G.J., Chen, H.H.: Visited websites may reveal users’ demographic information and personality. In: International Conference on Web Intelligence, pp. 248–252. IEEE (2019)
12.
Zurück zum Zitat Rand, W.M.: Objective criteria for the evaluation of clustering methods. J. Am. Stat. Assoc. 66(336), 846–850 (1971)CrossRef Rand, W.M.: Objective criteria for the evaluation of clustering methods. J. Am. Stat. Assoc. 66(336), 846–850 (1971)CrossRef
13.
Zurück zum Zitat Romano, S., Vinh, N.X., Bailey, J., Verspoor, K.: Adjusting for chance clustering comparison measures. J. Mach. Learn. Res. 17(1), 4635–4666 (2016)MathSciNet Romano, S., Vinh, N.X., Bailey, J., Verspoor, K.: Adjusting for chance clustering comparison measures. J. Mach. Learn. Res. 17(1), 4635–4666 (2016)MathSciNet
14.
Zurück zum Zitat Schröder, C., Rahmann, S.: A hybrid parameter estimation algorithm for beta mixtures and applications to methylation state classification. Algor. Molec. Biol. 12(1), 1–12 (2017) Schröder, C., Rahmann, S.: A hybrid parameter estimation algorithm for beta mixtures and applications to methylation state classification. Algor. Molec. Biol. 12(1), 1–12 (2017)
15.
Zurück zum Zitat Vinh, N.X., Epps, J., Bailey, J.: Information theoretic measures for clusterings comparison: variants, properties, normalization and correction for chance. J. Mach. Learn. Res. 11, 2837–2854 (2010)MathSciNet Vinh, N.X., Epps, J., Bailey, J.: Information theoretic measures for clusterings comparison: variants, properties, normalization and correction for chance. J. Mach. Learn. Res. 11, 2837–2854 (2010)MathSciNet
16.
Zurück zum Zitat Wagner, S., Wagner, D.: Comparing clusterings: an overview. Universität Karlsruhe, Fakultät für Informatik Karlsruhe (2007) Wagner, S., Wagner, D.: Comparing clusterings: an overview. Universität Karlsruhe, Fakultät für Informatik Karlsruhe (2007)
17.
Zurück zum Zitat Zhang, T., Ramakrishnan, R., Livny, M.: Birch: an efficient data clustering method for very large databases. ACM SIGMOD Rec. 25(2), 103–114 (1996)CrossRef Zhang, T., Ramakrishnan, R., Livny, M.: Birch: an efficient data clustering method for very large databases. ACM SIGMOD Rec. 25(2), 103–114 (1996)CrossRef
Metadaten
Titel
Multivariate Beta Mixture Model: Probabilistic Clustering with Flexible Cluster Shapes
verfasst von
Yung-Peng Hsu
Hung-Hsuan Chen
Copyright-Jahr
2024
Verlag
Springer Nature Singapore
DOI
https://doi.org/10.1007/978-981-97-2242-6_19

Premium Partner