DFT in osnove naključnih procesov

DFT in osnove naključnih procesov#

Domača naloga#

Naloga

Z uporabo generatorja signalov in zajemnega sistema Arduino zajemite naključni signal s parametri (srednjo vrednostjo \(m\), amplitudo \(A\)) iz podatkov naloge. Zajem podatkov izvedite tako, da boste pri pretvorbi zajetega signala v frekvenčno domeno dobili spekter na podanem frekvenčnem območju \([0, f_k]\) ter z ločljivostjo v frekvenčni domeni \(\Delta f\) iz podatkov naloge.

LabView program za zajem signalov lahko prenesete v obliki zip arhiva.

Pripravite kratko poročilo v okolju Jupyter Notebook (od 3 do 10 celic s kodo), v katerem naj bodo razvidni podatki naloge ter prikaz in kratek komentar naslednjih lastnosti zajetega signala:

zajeto frekvenčno območje in frekvenčna ločljivost,
ocena gostote porazdelitve verjetnosti vrednosti \(p(x)\) zajetega signala \(x(t)\),
enostranska ter dvostranska avtospektralna gostota moči, \(G_{XX}\) in \(S_{XX}\),
prvi štirje centralni statistični momenti (\(m_1\), \(m_2\), \(m_3\), \(m_4\)) zajetega signala.

Dodatek:

Ovrednotite in komentirajte stacionarnost ter ergodičnost zgoraj generiranega naključnega signala (po potrebi zajemite dodatne signale, ki jih za to potrebujete).
Numerično generirajte in komentirajte primera nestacionarnega gaussovega ter stacionarnega ne-gaussovega naključnega signala (glejte na primer pyExSi).

Poročilo oddajte v .pdf obliki (glejte navodila za oddajo domačih nalog).

Diskretna Fourierova transformacija#

Računamo Fourierovo transformacijo diskretnega signala, \(x_n = x(n\,\Delta t)\). Kadar imamo končno mnogo vzorčenih podatkov (\(N\)) in gre \(n=[0,1,\dots,N-1]\), uporabimo diskretno Fourierovo transformacijo (DFT).

Note

Diskretna Fourierova transformacija:

\[ X_k = \sum_{n=0}^{N-1} x_n\,e^{-\mathrm{i}\,2\pi\,k\,n/N}. \]

Velja \(X_k=X(k/(N\,\Delta t))\).

Ker je DFT periodična z \(1/\Delta t\) (\(X_k=X_{k+N}\)), je treba izračunati samo \(N\) členov.

Modul numpy.fft izračuna \(X_k\) za diskretne frekvenčne točke pri \(k \in [-N/2, \dots, 0,\dots\,N/2-1]\) (v primeru sodega števila točk \(N\)).

Primer 1

Poglejmo diskretizacijo frekvenčnega vektorja pri DFT signala, vzorčenega pri časih: \(t = [0, 1, 2, \dots, 9] s\):

t = np.arange(0, 10)
delta_t = t[1] - t[0]
n = len(t)
delta_t, n

(1, 10)

np.fft.fftfreq(len(t), t[1]-t[0])

array([ 0. ,  0.1,  0.2,  0.3,  0.4, -0.5, -0.4, -0.3, -0.2, -0.1])

np.fft.rfftfreq(len(t), t[1]-t[0])

array([0. , 0.1, 0.2, 0.3, 0.4, 0.5])

Osnove naključnih procesov#

Procese, ki jih ne moremo obravnavati kot deterministične, pogosto modeliramo kot naključne procese.

Za te je značilno, da njihovih dejanskih vrednosti v času \(x(t)\) ne moremo natančno predvideti, lahko pa z določeno verjetnostjo sklepamo o porazdelitvi njihovih vrednosti. Tako definiramo funkcijo gostote porazdelitve verjetnost, \(p(x)\), ki podaja verjetnost, da se bo v vzorcu naključne spremenljivke \(x(t)\) pojavila določena vrednost \(x\).

Lastnosti takih signalov je pogosto smiselno obravnavati v frekvenčni domeni.

Primer 2

Normalno porazdeljena naključna spremenljivka \(x\) z \(N=1000\) vzorci, srednjo vrednostjo \(\mu = 5\) in standardno deviacijo \(\sigma = 2\) predstavlja realizacijo N ponovitev naključnega dogodka.

Ocenimo prva dva centralna statistična momenta funkcije gostote verjetnosti (\(n = [1, 2]\)):

\[ \sigma^n(t)= E[(x(t)-\mu_x)^n] = \int_{-\infty}^{+\infty} (x-\mu_x)^n\, p(x)\, \textrm{d} x \]

N = 1000
mu = 5
sigma = 2

x = np.random.randn(N)*sigma + mu

x_center = x - np.mean(x)

s_1 = np.mean(x_center)
s_1

4.334310688136611e-16

s_2 = np.mean((x_center)**2)
s_2

4.113595121505609

Bolj splošen generator naključnih vrednosti v Numpy:

rng = np.random.default_rng()
y = rng.normal(loc=mu, scale=sigma, size=N)

../_images/dc20b92419eff033b290445ffe3921c90e6eed38f42e0d2ec1b82fad65b12370.png

Porazdelitev verjetnosti ni nujno normalna (Gaussova):

z = rng.weibull(a=2.5, size=N)

../_images/1c837d2e5c24ba1fa30fa357af1792a5ad75b85208e26abc3c05eec0edf54158.png

../_images/b1344fa542f4a12321ad10adb668928a82ebc6df851393640ca6db7ebb449ff1.png

Note

Naključni proces \(x(t)\) je stacionaren, če so srednja vrednost in kovariančne funkcije procesa časovno neodvisne.

Naključni proces \(x(t)\) je ergodičen, če so statistične lastnosti nižjega reda ene same realizacije procesa v času (\(x(t)\)) enake statističnim lastnostim ansambla več realizacij dogodka \(x_k(t)\). Pravimo, da je posamezna realizacija procesa reprezentativna.

Primer 3

Opazujemo naključni proces \(x(t)\) z normalno porazdelitvijo verjetnosti (\(\mu = -4\), \(\sigma = 1\)), definiran v 25 časovnih točkah \(t = [0, 1, \dots, 24]\). Posnamemo ansambel \(N=50\) realizacij naključnega procesa.

Opazujmo razvoj srednje vrednosti in variance signala v času, \(\mu_x(t)\) in \(\sigma^2_x(t)\).

t = np.arange(25)
N = 50
mu = -4
sigma = 1

ansambel = []
for ponovitev in range(N):
    ansambel.append(rng.normal(loc=mu, scale=sigma, size=len(t)))
ansambel = np.array(ansambel)
ansambel.shape # (50 realizacij, 25 "časovnih" točk)

(50, 25)

../_images/886875e7d7fcf74dc5aeee8d741aabb3e7fa6472972aac80d5397a3dded2f66b.png

Srednja vrednost in varianca pri vsakem časovnem trenutku procesa (izračunana po osi realizacij):

mu_t = np.mean(ansambel, axis=0)
var_t = np.mean((ansambel-np.mean(ansambel, axis=0))**2, axis=0)

../_images/ac74937db5b9506564c6b7461dac483838ad5ba7589bcb2136fede6408262202.png

Ker se srednja vrednost in varianca naključnih realizacij v isti točki procesa s časom ne spreminjata, lahko sklepamo, da gre za stacionaren proces.

Srednja vrednost in varianca posameznih realizacij procesa (izračunana po osi časa):

mu_ansambel = np.mean(ansambel, axis=1)
var_ansambel = np.mean((ansambel-np.mean(ansambel, axis=1)[:, None])**2, axis=1)

../_images/5f2c126315d86b3f50e69182fd5c1731a863a48b0eb82cc8cab99fbbd54e9ce9.png

Ker se srednja vrednost in varianca naključnega procesa \(x(t)\) pri večkratni realizaciji ne spreminjata, in sta enaki \(\mu_x(t)\) in \(\sigma^2_x(t)\) pri posameznem času, lahko sklepamo, da gre za ergodičen proces.

Note

Avto-korelacijska funkcija \(R_{xx}(\tau)\) je definirana z:

\[R_{xx}(\tau) = E[ x_k(t) \, x_k(t+\tau)]\]

in je enaka avto-kovariančni funkciji v primeru procesa z nično srednjo vrednostjo.

Note

Avto-spektralna gostota moči (PSD, Power Spectral Density) je Fourierova transformacija avtokorelacijske funkcije signala:

\[S_{xx}(f) = \mathcal{F}\big(R_{xx}(\tau)\big)\]

Za ergodičen proces jo lahko izračunamo kot:

\[S_{xx}(f) = \frac{1}{T}\, X^*(f) \, X(f)\qquad\text{PSD}.\]

Primer 4

Opazujemo naključni proces \(a(t)\), definiran z:

\[a(t) = \sin(10 \, \pi \, t) + n(t),\]

kjer je \(n(t)\) naključni šum z normalno porazdelitvijo (\(\mu=0\), \(\sigma=0.5\)).

Opazujmo avtokorelacijsko funkcijo \(R_{aa}(t)\) in gostoto spektralne moči \(S_{aa}(f)\) signala \(a(t)\).

f = 5
T = 1
fs = 100
t = np.arange(fs*T) / fs
N = len(t)
a = np.sin(2*np.pi*f*t) + np.random.randn(len(t))*0.5

R_aa = np.correlate(a-np.mean(a), a-np.mean(a), mode='full') / np.std(a)**2 / N

../_images/d84f4b019eda70bdbf4a7c0f88e54a5cc52b1c6bee1dd7db5a51622388a5c904.png

R_aa = R_aa[-len(a):]

../_images/d6f39572bf9696050ee1f7189b63da51897b12e866f5871df11d1685124c9e0e.png

G_aa_ = np.fft.rfft(R_aa) * 2 / fs # Ne delimo z N, ker smo normirali že R_aa

A = np.fft.rfft(a) # Ne delimo z N, ker bomo normiranje opravili pri izračunu G_aa
freq = np.fft.rfftfreq(len(a), 1/fs)
G_aa = np.conj(A) * A  * 2 / fs / N

Izračun PSD v Scipy:

from scipy.signal import welch
f_scipy, G_aa_scipy = welch(a, fs=fs, scaling='density', window=np.ones_like(a))

../_images/d9932f5a2706a2903903f534ca036195c89a5333ea765a3d81d9bde44b294cf4.png

Parsevalov teorem:

a.var(), np.trapz(np.abs(G_aa), freq)

(0.8206545316669873, 0.8225632279176867)

DFT in osnove naključnih procesov

Contents

DFT in osnove naključnih procesov#

Domača naloga#

Diskretna Fourierova transformacija#

Osnove naključnih procesov#