Tentin tekstisisältö

DATA.ML.320 Knowledge Mining and Big Data - 08.05.2025

Tentin tekstisisältö

Teksti on luotu tekstintunnistuksella alkuperäisestä tenttitiedostosta, joten se voi sisältää virheellistä tai puutteellista tietoa. Esimerkiksi matemaattisia merkkejä ei voida esitää oikein. Tekstiä käytetään pääasiassa hakutulosten luomiseen.

Alkuperäinen tentti
Tampere University
Faculty of Information Technology and Communication Sciences

Data.ml.320 Knowledge Mining and Big Data (5 cr)
Exam 8.5.2025 / Ari Visa

Please, do not forget the Kaiku-feedback!

 

1. Define terms: Data warehouse, Data Lake, 6p
and Knowledge Mining

An example of a definition:

Data: Facts and things certainly known. Data are any
facts, numbers, or text that can be processed by a
computer.

 

2. Why do you use HADOOP? Are there 6p
alternatives to HADOOP? What is HADOOP?
How do you use HADOOP when solving a
clustering problem? What is the relation
between cloud computing and HADOOP?

 

3. What do you know about associative analysis? | 6p

 

4. What is the difference between classification | 6p
and prediction? You have only 2 labeled
samples of type X = (x: , X2, x3) ", consisting of
real numbers. You should make a predictive
model. What kind of model do you use?
Motivate your answer! What is the robustness of
your solution?

 

 

5. How do you define cluster analysis? How 6p
can you estimate the number of clusters?
Motivate your answer.

You have 1T (=10!) samples of high
dimensional data (dimension > 100) available.
What kind of clustering method do you use?
Motivate your answer! How does computer
architecture influence your proposal?

 

 

 

 


Käytämme evästeitä

Tämä sivusto käyttää evästeitä, mukaanlukien kolmansien puolten evästeitä, vain sivuston toiminnan kannalta välttämättömiin tarkoituksiin, kuten asetusten tallentamiseen käyttäjän laitteelle, käyttäjäistuntojen ylläpitoon ja palvelujen toiminnan mahdollistamiseen. Sivusto kerää käyttäjästä myös muuta tietoa, kuten käyttäjän IP-osoitteen ja selaimen tyypin. Tätä tietoa käytetään sivuston toiminnan ja tietoturvallisuuden varmistamiseen. Kerättyä tietoa voi päätyä myös kolmansien osapuolten käsiteltäväksi sivuston palvelujen tavanomaisen toiminnan seurauksena.

FI / EN