Postfiksna notacija - kako računari računaju?
Uvod
Uobičajeni način zapisivanja matematičkih izraza (koji podrazumeva da se znak operacije zapisuje između dva operanda), poznat je kao infiksna notacija i ima sledeće odlike:
- znaci operacija povezuju operande (promenljive i brojčane vrednosti)
- operacije množenja i deljenja imaju veći prioritet od operacija sabiranja i oduzimanja
- zagrade imaju najveći prioritet i pojavljuju se po potrebi - zarad definisanja prioriteta različitih delova izraza
Shodno utvrđenim pravilima sa kojima se susrećemo kako u matematici tako i u svakodnevnom životu, do vrednosti izraza dolazi se na nedvosmislen način, što možemo ilustrovati preko izraza 5 * (2 + 4)
u kome sabiranje prethodi množenju (s obzirom na to da se sabirci nalaze u zagradi), i stoga se izraz prvo svodi na 5 * 6
, a potom na krajnji rezultat 30
.
Međutim, iako je - iz perspektive ljudi - postupak računanja preko infiksne notacije: razumljiv, jednostavan za usvajanje i (reklo bi se) prijemčiv i neproblematičan, za upotrebu u računarskoj tehnici - infiksna notacija ni iz daleka nije najbolji izbor.
Možda ne deluje intuitivno na prvi pogled, ali, izrazi nalik na ab+
i ab+cd-/
koji su zapisani korišćenjem tzv. postfiksne notacije, na računarima se rešavaju primetno brže od infiksnih izraza kao što su a+b
i (a+b)/(c-d)
.
U nastavku ćemo ukratko prodiskutovati o tome zašto infiksna notacija nije optimalan izbor za računarske algoritme * koji se tiču računanja vrednosti izraza, nakon čega ćemo se pozabaviti "tehničkim osobinama" postfiksnog zapisa ....
Nedostaci infiksne notacije
.... u kontekstu primene u računarskim algoritmima
Iz perspektive programera koji tek savladavaju osnove i nisu se još uvek susretali sa metodama za procenu vrednosti algebarskih izraza, ideja o korišćenju uobičajene infiksne notacije u računarskim algoritmima - verovatno deluje "prirodno", ali, u implementaciji takve ideje, postoje problemi koji se svode (najprostije rečeno), na to da računari - za razliku od ljudi - nisu sposobni da odjednom sagledaju "širu sliku". *
Čak i u slučaju jednostavnog infiksnog izraza u formatu a * (b + c)
(kao u uvodu), računarski program ne može sa sigurnošću izvršavati operacije u onom trenutku kada se pojave, to jest - u opštijem smislu - potrebno je bar jednom proći kroz ceo izraz (u najboljem slučaju) - i tek onda se vratiti na izvršavanje operacija.
Zapravo, izraz ne mora obuhvatiti ni dve operacije: izraz u formatu a + b
skoro je najjednostavniji mogući izraz, ali, ni u ovom slučaju računar ne sme odmah da obavi sabiranje (sve dok ne uzme u obzir sve operande i operatore).
Posmatrajući stvari u modernom kontekstu, mnogi čitaoci se mogu zapitati šta je toliko "strašno" u vezi sa tim da program prođe kroz izraz više puta, uzme u obzir sve operande, operatore, zagrade i .... "nekako" .... odredi prioritet izvršavanja operacija, jer, u današnje vreme, čak i slabiji procesori mogu sve navedeno izvršiti u deliću sekunde (ili - još jednostavnije - ne deluje da je postupak računanja preko infiksne notacije "posebno problematičan"), međutim:
- kao programeri, u obavezi smo da uvek tražimo što bolja i što efikasnija rešenja (pogotovo kada su u pitanju elementarni problemi), čime ostavljamo što manje 'zbrke' generacijama programera koje dolaze posle nas
- poslednje što smo naveli, posebno je važilo na početku razvoja računarske industrije, kada računari, ne samo da nisu bili veoma brzi, već su (naprotiv) bili prilično 'tromi' *
U praktičnom smislu, nedostatak brzine prvobitnih računara (čak i po pitanju jednostavnih operacija kao što je računanje vrednosti matematičkih izraza), bio je takav da je neko vreme dovodio u pitanje početak razvoja računarske industrije ** ("ako računari ne mogu efikasno rešavati jednostavne matematičke izraze, kako se onda mogu koristiti za komplikovanije zadatke?!"), ali, problem je rešio holandski naučnik Edzger Dajkstra i ostavio pokoljenjima lep, jednostavan i efikasan algoritam koji se zasniva na isto tako lepom, jednostavnom i efikasnom (ali, nimalo uobičajenom), načinu beleženja matematičkih izraza ....
Postfiksna notacija
Postfiksna notacija * je sistem za zapisivanje matematičkih izraza, sa sledećim glavnim odlikama:
- operatori se pojavljuju posle operanada
- zagrade se ne pojavljuju u izrazima
Sistem za zapisivanje izraza u postfiksnom obliku razradio je australijski naučnik Čarls Hamblin, sredinom pedesetih godina 20. veka, po ugledu na (idejno sličnu) prefiksnu notaciju, koju je izumeo poljski matematičar Jan Lukašijevič i objavio 1924. godine.
Na prvi pogled, zapisivanje izraza bez zagrada može delovati "čudno", ali, uz iole ozbiljnije udubljivanje, prednosti postaju veoma očigledne - pogotovo kad je u pitanju upotreba u računarskim sistemima. **
Oblik izraza u postfiksnoj notaciji
Kao što smo prethodno naveli, pojava znaka operacije posle operanada, najočiglednija je odlika postfiksne notacije - što možemo ilustrovati preko sledećih primera:
- izraz
a + b
postajeab+
- izraz
a + (b * c)
postajeabc*+
Da bismo mogli razumeti pravi smisao ovakvog načina zapisivanja (to jest, da bismo mogli razumeti zašto postfiksni izrazi predstavljaju praktičniji način zapisa matematičkih izraza na računarima (u odnosu na infiksnu notaciju)), potrebno je sagledati kako se računa vrednost postfiksnih izraza, i potrebno je razmotriti kako postfiksni izrazi (uopšte) nastaju.
Postupak računanja vrednosti postfiksnog izraza, pokazaćemo odmah (u nastavku), u daljem toku članka pokazaćemo na koji način ljudi mogu pretvarati infiksne izraze u postfiksne (sagledavanjem i rasuđivanjem), dok ćemo nešto komplikovanijem algoritamskom postupku za pretvaranje infiksnih izraza u postfiksne izraze, uskoro posvetiti nekoliko članaka.
Pri računanju vrednosti izraza, smatraćemo da promenljive imaju sledeće vrednosti:
- a = 4
- b = 3
- c = 2
.... iz čega sledi da vrednost izraza a * (b + c)
, odnosno, izraza 4 * (3 + 2)
, iznosi 20.
Kada se u postfiksnoj notaciji promenljive zamene navedenim (konkretnim) vrednostima, izraz postaje:
4 3 2 + *
Računanje vrednosti
Postfiksni izrazi rešavaju se na sledeći način:
- posmatrajući elemente sleva nadesno, traži se prvi (ili, u opštem smislu - sledeći ), znak operacije
- kada se pronađe znak operacije, nad dve vrednosti levo od znaka obavlja se operacija koja odgovara znaku
- umesto dva operanda i znaka (iz prethodnog koraka), u izrazu ostaje samo rezultat operacije
- postupak se ponavlja sve dok u izrazu (posle poslednje izvršene operacije), ne ostane samo jedan operand
- preostali operand predstavlja vrednost početnog izraza
U primeru koji razmatramo (izraz: 4 3 2 + *
), prvo se u obzir uzima znak operacije sabiranja, a u obzir se uzimaju i dve brojčane vrednosti sa leve strane (ili, praktično, prvo se rešava izraz 3 2 +
):
- obavlja se operacija sabiranja
- rezultat sabiranja (5), ostaje u izrazu umesto brojeva 3 i 2
- znak koji predstavlja operaciju sabiranja, uklanja se iz izraza
Izraz postaje: 4 5 *
(na sličan način kako je izraz 4 * (3 + 2)
mogao biti sveden na izraz 4 * 5
), i preostaje samo da se postupak ponovi sa operacijom množenja - pri čemu se dobija rezultat 20.
Poenta je sledeća: ceo izraz (kao što vidimo), rešava se u jednom prolasku, to jest, svaka operacija obavlja se u onom trenutku kada se naiđe na znak operacije:
- nema dvoumljenja (za ljude)
- relativno lako se može osmisliti i računarski algoritam koji funkcioniše po sličnom principu (bez grananja, tj. odlučivanja)
Ukratko o prefiksnoj notaciji
Prefiksna notacija (nije teško pretpostaviti), podrazumeva sličan pristup kao i postfiksna notacija, s tom razlikom što se operator beleži pre operanada:
- izraz
a + b
postaje+ab
- izraz
a + (b * c)
postaje+a*bc
Procena vrednosti obavlja se 'u obrnutom smeru', u odnosu na idejno sličan postupak koji smo videli u prethodnom poglavlju (npr. u drugom izrazu, prvo se obavlja množenje, pa onda sabiranje).
"Neobrnuta" poljska notacija takođe se koristi u računarskim algoritmima (bila je posebno popularna na prvim elektronskim kalkulatorima, pre više decenija), ali, za sada ćemo se zadržati na proučavanju i korišćenju postfiksne notacije, budući da takav zapis (ipak) prirodnije odgovara većini algoritama.
Uglavnom, u oba slučaja, oslobodili smo se zagrada (posle čega se vrednost izraza može izračunati u jednom prolasku), i samo još preostaje pitanje: kako od infiksnog izraza napraviti postfiksni.
Primer kreiranja postfiksnog izraza
Pre upoznavanja sa 'zvaničnim' postupkom za pretvaranje infiksnih izraza u postfiksne (što ostavljamo za drugu priliku), potrebno je da se upoznamo sa idejama koje stoje iza postupka - što ćemo najlakše izvesti ukoliko izraze predstavimo preko grafičkih simbola (ili, jednostavnije, preko "slika").
U izrazu prvo treba uočiti operaciju koja, u širem kontekstu, ima najniži prioritet (to jest, operaciju koja se izvršava 'na kraju'), i potom treba postaviti znak uočene operacije u koren "stabla" izraza (u konkretnom izrazu koji koristimo kao primer: a * (b + c)
, u pitanju je operacija množenja).
Ostali operatori iz izraza (tj. "znaci operacija"), raspoređuju se u stablo shodno prioritetu izvršavanja.
U primeru koji koristimo: sa leve strane biće promenljiva a
(koja u množenju učestvuje samostalno), dok će sa desne strane biti "podstablo" koje samo po sebi predstavlja operaciju sabiranja promenljivih b
i c
(operacija koja, očigledno, dolazi na red pre množenja zbira b + c
sa promenljivom a
).
Pošto je stablo formirano, pristupa se "obilasku stabla", na sledeći način: počevši od korena, na svakom čvoru koji predstavlja operaciju, prvo se "skreće" levo, a tek kada se dođe do 'krajnjeg levog čvora' (u bilo kom podstablu), sledi povratak jedan korak unazad - na čvor koji predstavlja operaciju - i potom se skreće desno, ali - posle svakog skretanja udesno (kada se nađemo u novom podstablu) - opet se prvo skreće levo (i opet se "držimo leve strane").
Kada se u kretanju kroz stablo pronađe operand (tj. promenljiva), odmah se prebacuje u postfiksni izraz, međutim, operatori (znaci operacija), mogu se prebacivati tek pošto je u postfiksni izraz već prebačeno celo podstablo koje je vezano za operaciju (tj, podstablo koje u korenu ima znak operacije).
Krenimo redom i pogledajmo postupak obilaska na primeru izraza koji smo do sada koristili: a * (b + c)
.
Prvo se u obzir uzima poslednja operacija koja se izvršava (znak množenja na vrhu stabla) ....
.... ali, pošto nijedan od znakova iz podstabala koja izviru iz korenog čvora, nije upisan, znak množenja za sada se mora preskočiti.
Prelazimo na levu stranu ....
Čvor predstavlja promenljivu, i stoga će odmah biti prebačen u izraz sa postfiksnom notacijom.
Vraćamo se na prvi čvor ....
.... ali, budući da ni sada nisu rešena oba podstabla korenog čvora (iako je leva strana rešena), čvor *
se ni ovoga puta ne može prebaciti u izraz sa postfiksnom notacijom.
Pošto u prethodnim koracima nismo završili u potpunosti sa prvim čvorom, ali, jesmo završili sa levim podstablom (čvor a
), prelazimo na desno podstablo.
U desnom podstablu, prvo se ispituje čvor koji odgovara operaciji sabiranja ....
.... ali, budući da nijedno podstablo ovog čvora nije rešeno, za sada (u smislu ispisa), operator sabiranja se preskače.
U korenu levog podstabla operacije sabiranja ....
.... nailazimo na operand b
, koji se odmah prebacuje u izraz sa postfiksnom notacijom.
Vraćamo se na operator sabiranja i ispitujemo da li je čvor +
spreman za prebacivanje u postfiksni izraz ....
.... međutim, budući da desno podstablo operatora +
nije rešeno, operator +
i dalje se ne upisuje u postfiksni izraz.
Prelazimo u desno podstablo operacije sabiranja ....
.... i odmah se operand c
može prebaciti u izraz sa postfiksnom notacijom.
Ponovo se vraćamo na čvor +
....
.... i sada se čvor +
može prebaciti u izraz sa postfiksnom notacijom, budući da je rešeno celo podstablo koje se odnosi na operaciju sabiranja.
Na kraju, vraćamo se na koreni čvor ....
.... i, budući da je celo stablo, osim korenog čvora, već prebačeno u izraz sa postfiksnom notacijom, može se upisati i sam koreni čvor.
Cela operacija je završena: sve promenljive i svi znakovi operacija, prebačeni su u postfiksnu notaciju.
Ukoliko je potrebno, pogledajte ponovo ceo primer.
Za vežbu ....
Na kraju, pokušajte sami da pretvorite bar nekoliko * infiksnih izraza u izraze sa postfiksnom notacijom - na papiru.
Za proveru rezultata možete koristiti mini-aplikaciju ispod (dozvoljeni znaci: mala slova, znaci operacija i zagrade).
Za dalje istraživanje ....
Dodatne informacije u vezi sa različitim notacijama algebarskih izraza, možete pronaći preko sledećih linkova
Prefiksna notacija Postfiksna notacija Jan Lukašijevič Edsger Dajkstra