Tips & Tricks

Julia

Začít s

using Statistics, Distributions, Random, LinearAlgebra, Clustering, StatsBase, Plots, StatsPlots, HypothesisTests

Potřebné balíčky: Distributions, Clustering, StatsBase, Plots, StatsPlots,HypothesisTests

vektor prúměrů mean(X; dims = 1)
kovarianční matice cov(X)
výběrová korelační matice cor(X)
vlastní čísla a vlastní vektory výběrové kovarianční matice
vals, vecs = eigen(X)
- procenta variability cumsum(vals) / sum(vals) * 100
- hodí se na PCA
matice vzdáleností dist(X) přičemž potřebujeme první definovat
dist(X; itr = eachrow) = [norm(vec1 - vec2) for vec1 in itr(X), vec2 in itr(X)]
shlukování hcl = hclust(dist(X); linkage = :single) (více zde)
- dobré potom ještě použít cuttree(hcl; k = <chtěný počet clusterů>)
výběrová distribuční funkce (vektorová data X - pouze jednorozměrná)
plot((minimum(X) - 5):0.01:(maximum(X) + 5), y -> ecdf(X)(y))

kvantil na hladině $\alpha$ quantile(<distribution>, α) např.
quantile(Normal(0,1), 0.95)
hodnota distribuční funkce v bodě cdf(<distribution>, <where>) např.
cdf(Normal(0,1), 1.6)