Ebben a notebookban rövid példákon keresztül megismerkedünk a Python nyelv szintaxisával, illetve néhány alapvető adattípussal és adatstruktúrával. Később ezeket és az ezekből származtatott adatstruktúrákat fogjuk lépten-nyomon használni.
A Pythonban a megjegyzések kettőskereszttel ('#') kezdődnek, és a sor végéig tartanak. Egy megjegyzés lehet sor elején, vagy követhet szóközt, tabulátor karaktert, de ha egy karakterlánc (string) belsejébe teszed, az nem lesz megjegyzés (lásd a példában!). A kettőskereszt karakter egy karakterláncon belül csak egy kettőskeresztet jelent.
# ez az első megjegyzés
SPAM = 1 # ez a második megjegyzés
# ... és ez a harmadik.
STRING = "# Ez nem megjegyzés, mert idézőjelekben van."
A komment csak a programozónak szól emlékeztetőül, vagy más programozók megértését segíti. Noha gyakran elmarad, a kódok rendszeres dokumentálása megjegyzésekkel később (amikor már a kód részleteit a feledés homálya borítja) nagyon kifizetődő lehet.
A notebookot lehet úgy használni, mint egy sima számológépet: be lehet írni egy kifejezést, és az kiszámolja az értékét. A kifejezések nyelvtana a szokásos: a +, -, * és / műveletek ugyanúgy működnek, mint a legtöbb nyelvben (például Fortran vagy C). A zárójeleket értelemszerűen az elvégzendő műveletek csoportosítására, a műveleti sorrend meghatározására használjuk. Például:
2 + 2
50 - 5*6
(50 - 5*6) / 4
8 / 5 # az osztás egész számok esetén is lebegőpontos eredményt ad.
Az egész számok (pl. 2, 4, 20) alkotják az int típust, a valós számok (pl 5.0, 1.6) pedig a float típust. A Python 3-ban az osztás (/) mindig lebegőpontos értékeket ad vissza. Lefelé kerekítő egészosztás elvégzéséhez, amellyel egész értéket kapunk, a // operátor használható; az osztás maradékához a %-t hívhatjuk segítségül:
17 / 3 # hagyományos osztás lebegőpontos eredménnyel
17 // 3 # az egészosztással megszabadulunk a törtrésztől
17 % 3 # a % operátor az osztás maradékával tér vissza
5 * 3 + 2 # eredmény * osztó + maradék
A Pythonban a ** operátor használható a hatvány kiszámítására:
5 ** 2 # 5 négyzete
2 ** 7 # 2 7. hatványa
A Python
a lebegőpontos számokat bizonyos tekintetben előnyben részesíti az egész számokhoz képest. Azok a műveletek, amelyeknél keverednek a típusok, az egészeket lebegőpontossá alakítják:
3 * 3.75 / 1.5
7.0 / 2
Előfordul néha, hogy egyes függvények int
típusú változót, várnak és ezt egy float
típusúból kell előállítanunk. A típusok közti konverziót az int() és float() függvények segítségével tehetjük meg.
int(3.1415)
float(42)
A Python
komplex számokat is tud kezelni, a képzetes részt a j vagy J jellel képezhetjük. A komplex számot (valós+képzetes j) formában írhatjuk:
1j * 1J
3+1j*3
(3+1j)*3
(1+2j)/(1+1j)
A komplex számokat gyakran két lebegőpontos számmal ábrázolják: a képzetes és a valós résszel. A z
komplex számnak ezeket a részeit talán kicsit szokatlan módon (a változó után írt .
és a megfelelő szó ) a z.real
és z.imag
utasításokkal olvashatjuk vissza.
(1.5+0.5j).real
(1.5+0.5j).imag
A lebegőpontos és egész típusú konverziós függvények (float()
és int()
) nem működnek komplex számokra.
A komplex-valós átalakításnak több lehetséges módja is van: ahhoz, hogy egy komplex számból valósat csinálj, használd az abs(z) utasítást, hogy megkapd a nagyságát, vagy a fent már megismert z.real
és z.imag
utasítást, ha a valós része vagy a képzetes része kell.
float(3.0+4.0j) # ez nem működik
abs(3.0+4.0j) # sqrt(a.real**2 + a.imag**2)
Programozási feladatok során rendszerint változókban tároljuk a hasznos információkat. A megírt programok nem konkrét számértékekre, hanem változókra hivatkoznak, ez teszi lehetővé, hogy különböző bemeneti adatokra ugyanazt az algoritmust ha kell, többször is lefuttathassuk. A változók neveit rendszerint az angol ABC betűiből és esetleg néhány egyéb karakterből szokás összeállítani. Például:
szelesseg # ebben csak betűk vannak
a_folyoso_hossza # ebben a változó névben szerepel a _ karakter is
A változók neveit célszerű úgy megválasztani, hogy később könnyen kitalálható legyen, mit is jelöltünk vele. A legtöbb programozási nyelvhez hasonlóan az egyenlőségjellel (=) lehet értéket adni egy változónak. Az értékadás után az értelmező újabb utasításra vár, látszólag nem történik semmi:
szelesseg = 20
magassag = 5*9
A háttérben viszont létrejöttek a szelesseg
és magassag
változók, amikkel most már hasznos dolgokat tudunk művelni. Számítsuk ki például a két változó szorzatát:
szelesseg * magassag
Ha egy változó nincs definiálva (nincs érték rendelve hozzá), és használni próbáljuk, akkor hibaüzenetet kapunk:
n # Az n változót még nem definiáltuk
Az utoljára kiírt kifejezés értéke az _ (alsóvonás) változóban van. Így ha a Pythont asztali számológépként használod, akkor egyszerűbb folytatni a számolásokat, például:
ado = 12.5 / 100
ar = 100.50
ar * ado
ar + _
round(_, 2) #kerekítés 2 tizedes jegyre
Ezt a változót csak olvasható változóként kezelhetjük. Ne adjunk értéket neki, mert ha adunk, akkor létrehozunk egy független helyi változót azonos névvel, amely meggátolja a beépített változó elérését, amely mágikus módon viselkedik. (Ha egy globális változó nevével létrehozunk egy helyi változót, akkor az értelmező a helyit használja.)
A notebookban az előző eredményen kívül jóval korábbi eredményekre is hivatkozhatunk. Például 2. parancs kimenetére a következőképpen:
Out[2]
Ahhoz, hogy a program reagálni tudjon bemenetekre, vagy egy már kiszámolt részeredménytől függhessen további működése, szükség van feltételek vizsgálatára. Gondoljunk például a másodfokú egyenlet megoldóképletére! Attól függően, hogy a diszkrimináns pozitív vagy negatív, léteznek, ill. nem léteznek valós gyökök, így értelemszerűen egy ilyen programnak "döntenie" kell. A döntés egy feltétel vizsgálatán alapul (pl. poz. vagy neg. diszkrimináns), ami lehet igaz vagy hamis, angolul True, ill. False. Az igaz és hamis értéket tárolni képes változó típusa: boolean (Bool-változó). (Emlékezzünk vissza az int ill. float típusokra.)
Két objektum azonosságáról dupla egyenlőségjellel, azaz a == operátor segítségével tájékozódhatunk.
1 == 1 # 1 megeggyezik 1-gyel ?
1 == 2 # 1 megeggyezik 2-vel ?
Ha arról akarunk meggyőződni, hogy két objektum nem ugyanaz, akkor ezt a != operátor segítségével tehetjük meg:
1!=2 #1 nem 2 ?
Természetszerűen számok esetén a <,> operátorok segítségével dönthetjük el, hogy melyik szám a nagyobb:
1>2
1<2
1j+3>2 # komplex számokra nem értelmezzük a <> jeleket!!
Egy igaz/hamis értéket változóban is tárolhatunk:
igazvagyhamis= 2*2==5
igazvagyhamis
Relációkat láncolhatunk is, például: az a < b == c megvizsgálja, hogy az a kisebb-e mint b, és ezen felül b egyenlő-e c-vel.
b=2
1 < 2 == b
b=3
1 < 2 == b
A relációkat összefűzhetjük and és or logikai műveletekkel is. Egy reláció erdményét (vagy bármely logikai műveletét) az ellentettjére változtathatjuk a not művelettel.
not 2*2==5
Az and, or és not függvények – ha zárójelezést nem alkalmazunk – akkor a relációjelek után kerülnek kiértékelésre (más szóval mondva a relációjelekhez képest alacsonyabb a precedenciájuk). A három logikai művelet közül a not értékelődik ki legelőször (neki a magasabb a precedenciája a másik kettőhöz képest), és az or értékelődik ki utolsónak.
Tehát az A and not B or C ugyanazt jelenti, mint az (A and (not B)) or C. Természetesen a zárójeleket használhatunk a kívánt műveleti sorrendű feltétel eléréséhez.
b=3
((1==2) and (3==4)) or (b==3)
A számok mellett a Python karakterláncokkal, például szavakkal is tud műveleteket végezni. A karakterláncokat egyszeres ('...') vagy dupla idézőjelek ("...") közé lehet zárni. A két jelölés között nincs jelentős különbség. A \ használható arra, hogy a karakterláncbeli idézőjeleket levédjük:
'spam eggs'
'doesn\'t'
"doesn't"
'"Yes," he said.'
"\"Yes,\" he said."
'"Isn\'t," she said.'
A kimeneti karakterlánc idézőjelekben jelenik meg, a speciális karakterek vissza-perrel (\) levédve. Bár ez néha különbözőnek látszik a bemenettől (az idézőjel fajtája megváltozhat), a két karakterlánc egyenértékű. A print() függvény egy sokkal olvashatóbb kimenetet eredményez, elhagyva az idézőjeleket és kiírva a levédett és speciális karaktereket:
print('"Isn\'t," she said.')
s = 'First line.\nSecond line.' # \n újsort jelent
s # print() nélkül a \n benne van a kimenetben
print(s) # print()-tel az \n újsort hoz létre
Ha nem akarod, hogy a \ jellel kezdődő karakterek speciális karakterként értelmeződjenek, akkor nyers karakterláncokat használhatsz egy r-et helyezve a kezdő idézőjel elé:
print('C:\some\name') # \n újsort jelent
print(r'C:\some\name') # r van az idézőjel előtt
A literális karakterláncok többsorosak is lehetnek. Egy lehetőség erre a hármas idézőjelek használata: """...""" vagy '''...'''. Ilyenkor az újsorok automatikusan belekerülnek a karakterláncba, de ez a viselkedés megszüntethető, ha a sor végére egy \-t adsz. A következő példa
print("""\
Usage: thingy [OPTIONS]
-h Display this usage message
-H hostname Hostname to connect to
""")
Karakterláncokat a + művelettel ragaszthatunk össze, és *-gal ismételhetünk.
3 * 'un' + 'ium'
Két egymást követő literális karakterláncot (azokat, amik idézőjelben vannak, és nem egy változóban, vagy nem egy függvény hoz létre) az értelmező magától összefűz:
'Py' 'thon'
De ez csak két literálissal működik, változóval vagy kifejezéssel nem:
prefix = 'Py'
prefix 'thon' # nem tud változót és literális karakterláncot összefűzni
Ha változókat akarsz összefűzni, vagy változót literálissal, használj + műveletet:
prefix = 'Py'
prefix + 'thon'
A literálisok összefűzése különösen hasznos hosszú sorok széttörésére:
text = ('Több karakterláncot írhatunk zárójelbe, '
'hogy összefűzhessük azokat.')
text
Minden karakterhez a karakterláncban a Python
rendel egy sorszámot (indexet). Az első karakterhez tartozik a 0
index, a következőhöz az 1
-es index és így tovább. (Ez a konvenció tükrözi a C-ben megszokottakat.)
szo = 'Python'
szo[0] # karakter a 0 pozícióban
szo[5] # karakter a 5 pozícióban
Az indexek negatívak is lehetnek, ilyenkor jobbról kezdünk el számolni:
szo[-1] # utolsó karakter
szo[-2] # utolsó előtti karakter
szo[-6]
Az indexelésen felül a szeletelés is támogatott. Míg az indexelés egyetlen karaktert jelöl ki, a szeletelés egy részkarakterláncot:
szo[0:2] # karakterek a 0 pozíciótól (benne van) a 2-esig (az már nem)
szo[2:5] # karakterek a 2 pozíciótól (benne van) a 5-esig (az már nem)
A kezdő index mindig beleértendő az eredménybe, a végső index pedig nem. Ez teszi lehetővé, hogy s[:i] + s[i:] mindig egyenlő legyen s-el:
szo[:2] + szo[2:]
szo[:4] + szo[4:]
A szeletek indexeinek hasznos alapértékei vannak; a kihagyott első index alapértéke 0, az elhagyott második index alapértéke a szeletelendő karakterlánc hossza:
szo[:2] # karakterek az elejétől a 2-esig (már nincs benne)
szo[4:] # karekterek a 4-es pozíciótól (benne van) a végéig
szo[-2:] # karakterek az utolsó előttitől (beleértve) a végéig
Jegyezd meg, hogy a -0 valóban azonos a 0-val, így ez nem jobbról számol!
szo[-0] # mivel -0 és 0 egyenlőek
A nem negatív indexek esetén a szelet hossza az indexek különbségével egyenlő, ha mindkettő a valódi szóhatárokon belül van. Például a szo[1:3] hossza 2. Ha olyan indexet használunk, amely túl nagy, az eredmény hibát ad:
szo[42] # a szó csak 7 karakteres
A Python karakterláncait nem lehet megváltoztatni, azok megváltoztathatatlanok. Ezért, ha egy adott indexű helyhez értéket rendelünk, hibát kapunk:
szo[0] = 'J'
Ha másik karakterláncra van szükség, alkothatunk egy újat:
'J' + szo[1:]
szo[:2] + 'py'
A beépített len() függvény a karakterlánc hosszával tér vissza:
s = 'legeslegelkáposztásíthatatlanságoskodásaitokért'
len(s)
A Python többfajta összetett adattípust ismer, amellyel több különböző értéket csoportosíthatunk. Egy igen sokoldalú összetett adattípus a lista, amelyet vesszőkkel elválasztott értékekként írhatunk be szögletes zárójelbe zárva. Az alábbiakban a listákkal kapcsolatos műveletek alapjait tekintjük át. Listákról magyarul itt egy kicsit bővebben olvashattok. A lista elemeinek nem kell azonos típusúaknak lenniük, bár sok alkalmazásban minden elem azonos típusú.
a = ['spam', 'tojások', 100, 1234]
a
['spam', 'tojások', 100, 1234]
Ahogy a karakterláncokat, a listákat is indexelhetjük és szeletelhetjük:
a[0]
a[3]
a[-2]
a[1:-1] # a szeletelés új listát ad
A listák az összefűzést is támogatják:
a[:2] + ['sonka', 2*2]
3*a[:3] + ['Boe!']
A karakterláncokkal ellentétben – amelyek megváltoztathatatlanok – a listák egyes elemeit módosíthatjuk:
a[2] = a[2] + 23
a
A szeleteknek értékeket is adhatunk, és ez akár a lista elemszámát is megváltoztathatja:
a[0:2] = [1, 12] # Pár elem átírása:
a
a[0:2] = [] # Pár elem törlése:
a
a[1:1] = ['bletch', 'xyzzy'] # Pár elem beszúrása:
a
a[:0] = a # Beszúrja magát (pontosabban egy másolatát) a saját elejére.
a
A beépített len() függvény listákra is alkalmazható:
len(a)
A listák egymásba ágyazhatóak, azaz listába elhelyezhetünk listát elemként:
a = ['a', 'b', 'c']
n = [1, 2, 3]
x = [a, n]
x
x[0]
x[0][1]
x[0][1]
Előfordul, hogy meg szeretnénk tudni, hogy egy adott elem hányadik helyen van a listában: ezt az .index()
függvény alkalmazásával kaphatjuk meg. Például nézzük meg, hogy a lent definiált autok
lista hányadik eleme a 'merci'
karakter:
autok=['skoda','vw','merci','mazda']
autok.index('merci')
Mint ahogy azt láttuk, a karakterláncok is indexelhetőek. Karakterláncban szereplő karakterek indexére is rákérdezhetünk az .index()
paranccsal:
betuk='abcdef'
betuk.index('e')
Szintén sokszor felmerülő probléma, hogy valamilyen objektumról el szeretnénk dönteni, hogy része egy listának. Például hogy mondjuk meg, hogy egy karakterlánc szerepel egy adott hosszú listában? Erre alkalmazható az in kulcsszó.
Tage_der_Woche=['Montag','Dienstag','Mittwoch','Donnerstag','Freitag','Samstag','Sonntag']
'hetfo' in Tage_der_Woche
'Montag' in Tage_der_Woche
Sokszor előfordul, hogy adatokat nem valamilyen sorrendben, hanem inkább valamilyen címke szerint szeretnénk tárolni. Tipikus példája ennek egy idegen nyelvű szótár, ahol egy magyar kifejezést egy más nyelvbeli kifejezéssel párosítunk. Ezeknél a struktúráknál sokszor nem lényeges a sorrend, gondoljunk itt például valamilyen tárgy tulajdonságaira. Legyen mondjuk egy autónk ami
Ezek a tulajdonságok egyértelműen meghatározzák az autót attól függetlenül, hogy a felsorolást milyen sorrendben tettük. Ilyen jellegű adatstruktúra a Python nyelvben a szótár vagy angolul a dictionary, röviden dict. A szótárak létrehozása kulcsszavak és a hozzájuk rendelt érték segítségével az alábbi szintaxis alapján történik:
tel = {'János': 4098, 'Simon': 4139}
tel
A listákkal ellenben, ahol sorszám alapján hivatkozunk egy elemre, itt kulcsszó alapján:
tel['János']
Új elemet is kulcsszó alapján adhatunk egy dict-hez:
tel['Géza'] = 4127
tel
Természetesen nem csak számokat adhatunk meg a szótárunkba mint hozzárendelt értéket:
tel['Brünhilda']='NEM TUDOM A SZÁMÁT'
tel
Így törlünk valakit a telefonkönyvből:
del tel['Simon']
tel
A dict-ben szereplő kulcsszavakat a ".keys()" metódus alkalmazásával tudjuk elérni.
tel.keys()
A fenti parancs kimenete látszólag tartalmazza az általunk kért információt. Sokszor azonban célszerű ezt az outputot a list()
parancs segítségével listává konvertálni:
list(tel.keys())
Vajon Géza benne van a telefonkönyvben? Ezt a listáknál megismert in
parancsal tudjuk ellenőrizni:
'Géza' in tel
Megjegyzés: Nyilván attól, mert Brünhilda benne van a telefonkönyvben, nem biztos, hogy tudjuk a telefonszámát:
'Brünhilda' in tel
tel['Brünhilda']
Az in
konstrukció tehát szótárak esetén azt ellenőrzi hogy egy bizonyos elem a szótár kulcsszavai között szerepel.
A dict függvény segítségével az alábbi módon is definiálhatunk szótárakat. Ez a szintaxisa hasznos lehet majd, ha változó argumentumszámú függvényekkel, vagy a plotly
csomaggal dolgozunk.
tel2=dict(Ica=1234,Maca=4321,Dada=5567)
tel2
Ahogy fentebb láttuk, egy objektumot egész számmá (int() függvény) vagy lebegőpontos számmá tudunk konvertálni ( float() függvény), illetve láttunk példát arra is hogy listává konvertáljunk valamit. Objektumokat Bool-változóvá is tudunk konvertálni. Erre szolgál a bool() függvény. Alább néhány példát nézzünk meg, hogy bizonyos dolgok mivé konvertálódnak a bool() függvénnyel.
Egy szám vagy egy karakterlánc True értéket ad:
bool(1.0)
bool('szoveg')
Hasonlóan True értéked ad, ha egy nem üres listát vagy általában egy más létező objektumot vizsgálunk:
bool([1,'Bela'])
False értéket ad a 0, az üres karakterlánc, illetve az üres lista:
bool(0)
bool(0.0)
bool('')
bool([])
Egy látszólag rosszul működő példa:
'a' == ('a' or 'b')
'b' == ('a' or 'b')
'a' == ('a' and 'b')
'b' == ('a' and 'b')
A második példa vajon miért False, ha az első True ? A harmadik miért False, ha a látszólag hasonló negyedik True? Ezen a ponton úgy tűnhet, hogy az and és or utasítások nem működnek megfelelően! Ha részletesen kiböngésszük, hogy mit is csinál a Python-értelmező, akkor kiderül, hogy pontosan azt teszi, amire megkértük. DE ez nem pontosan az, amire elsőnek gondolnánk! Az első két példa tehát nem azt ellenőrzi, hogy a == előtt álló karakter az szerepel-e a zárójelben. Mi is történik pontosan? Amikor a Python egy or kifejezéssel találkozik (a zárójeleken belül), sorba megy az or kifejezés által kapcsolatba hozott elemeken, és az első True-ként kiértékelhető objektum értékét adja vissza, tehát nem True vagy False-t hanem a változó értékét. Ez azért van így, mert ha egy or kifejezés egyik tagja igaz, akkor az egész kifejezés igaz. Az and ezzel szemben addig lépdel végig az alkotó kifejezéseken, amíg meggyőződött róla, hogy mindegyik kifejezés igaznak számít, és a legutolsó értéket adja vissza. A bool operációk ezen viselkedését rövid zár-nak hívják, és sok programozási nyelvben hasonlóan működik. Tehát ha arról akarunk meggyőződni, hogy egy kifejezés valamely kifejezéscsoport egyikével megegyezik, akkor az alábbiak szerint szükséges eljárni:
(('a' == 'a') or ('a' == 'b'))
(('b' == 'a') or ('b' == 'b'))