Frequently Asked Questions (FAQ) o PostgreSQL Ostatnia aktualizacja: Sobota Luty 7 22:16:21 EST 2004 Ostatnia aktualizacja tl/umaczenia: Piatek Marzec 5 19:31:12 EST 2004 Obecny maintainer: Bruce Momjian (pgman@candle.pha.pa.us) Tl/umaczenie: Marcin Mazurek (m.mazurek@netsync.pl) Najbardziej aktualna wersje tego dokumentu mozna znalezc pod adresem: http://www.PostgreSQL.org/docs/faqs/FAQ.html. Odpowiedzi na pytania dotyczace konkretnych systemów operacyjnych mozna znalezc pod adresem: http://www.PostgreSQL.org/docs/index.html. _________________________________________________________________ Pytania ogólne 1.1) Co to jest PostgreSQL? Jak to wymawiac? 1.2) Jaka licencja chroniony jest PostgreSQL? 1.3) Na jakich systemach Unixowych dzial/a PostreSQL? 1.4) Na jakich nie-Unixowych systemach dzial/a PostgreSQL? 1.5) Skad moge sciagnac PostgreSQL? 1.6) Gdzie mozna szukac wsparcia technicznego? 1.7) Jaka jest ostatnia dostepna wersja? 1.8) Jaka dokumentacja jest dostepna? 1.9) Gdzie moge znalezc informacje o znanych bl/edach czy brakujacych rozwiazanich? 1.10) Jak moge sie nauczyc SQL? 1.11) Czy PostgreSQL ma rozwiazany problem Y2K? 1.12) Jak moge sie przyl/aczyc do grupy osób bezposrednio pracujacych nad rozwojem PostgreSQL? 1.13) Jak moge zgl/aszac bl/edy? 1.14) Jak mozna porównac PostgreSQL w stosunku do innych DBMS? 1.15) W jaki sposób moge wesprzec finansowo PostgreSQL? Pytania uzytkowników 2.1) Czy sa jakies driwery ODBC dla PostgreSQL? 2.2) Jakie istnieja narzedzia pozwalajace na dostep do PostgreSQL przez www? 2.3) Czy istnieje jakies GUI dla PostgreSQL? 2.4) Za pomoca jakich jezyków programowania mozna sie komunikowac z PostgreSQL? Pytania dotyczace administracji 3.1) Jak moge zainstalowac PostgreSQL w innej lokalizacji niz /usr/local/pgsql? 3.2) Podczas startu postmaster'a, otrzymuje komunikat: Bad System Call lub "core dumped". Dlaczego? 3.3) Podczas startu postmaster'a, otrzymuje komunikat o bl/edzie: IpcMemoryCreate. Dlaczego? 3.4) Podczas startu postmaster'a, otrzymuje komunikat o bl/edzie: IpcSemaphoreCreate. Dlaczego? 3.5) W jaki sposób moge kontrolowac pol/aczenia z innych hostów? 3.6) Jak powinienem skonfigurowac system baz danych aby uzyskac lepsza wydajnosc? 3.7) Jakie sa mozliwosci wyszukiwania bl/edów? 3.8) Skad sie bierze komunikat: "Sorry, too many clients" podczas próby pol/aczenia sie z baza danych? 3.9) Jakie pliki znajduja sie w pg_temp? 3.10) Dlaczego konieczne jest przy upgradzie PostgreSQL korzystanie ze skryptów dump i restore? Pytania dotyczace uzytkowania 4.1) Jaka jest róznica pomiedzy kursorami binarnymi (binary cursors) i zwykl/ymi kursorami (normal cursors)? 4.2) Jak moge pobrac za pomoca SELECT jedynie kilka pierwszych wyników zapytania? 4.3) Jak moge uzyskac liste wszystkich tabel czy innych rzeczy pod psql? 4.4) Jak usunac kolumne z tabeli lub zmienic jej typ? 4.5) Jaki jest maksymalny rozmiar dla rzedu, tabeli i bazy danych? 4.6) Jak duzo miejsca w bazie danych jest potrzebne aby przechowac dane ze zwyczajnego pliku tekstowego? 4.7) Jak moge sprawdzic jakie tabele, klucze, bazy danych i uzytkownicy sa utworzeni? 4.8) Moje zapytania sa wolne lub nie uzywaja kluczy. Dlaczego? 4.9) Jak moge sprawdzic w jakis sposób "query optimizer" wykonuje moje zapytanie? 4.10) Co to jest "R-tree index"? 4.11) Co to jest "Genetic Query Optimizer"? 4.12) Jak moge uzywac wyrazen regularnych w zapytaniach i zapytan case-insensitive w wyrazeniach regularnych? Jak korzystac z indeksów dla zapytan case-insensitive? 4.13) Jak sprawdzic w zapytaniu czy pole ma wartosc NULL? 4.14) Jaka jest róznica pomiedzy róznymi typami tekstowymi (character types)? 4.15.1) Jak moge utworzyc pole typu int, które samo zwieksza swoja wartosc? 4.15.2) Jak pobrac wartosc pola typu SERIAL po wykonaniu insert'u? 4.15.3) Czy uzycie currval() i nextval() nie doprowadzi do "race condition" z innymi uzytkownikami? 4.15.4) Dlaczego numery sekwencji nie sa ponownie uzywane przy przerwaniu transakcji? Skad sie biora luki w numerowaniu kolumny tabeli sekwencjami/SERIALem? 4.16) Co to jest OID? Co to jest TID? 4.17) Jakie jest znaczenie niektórych terminów w PostgreSQL? 4.18) Skad bierze sie ten bl/ad: "ERROR: Memory exhausted in AllocSetAlloc()"? 4.19) Jak sprawdzic jakiej wersji PostgreSQL uzywam? 4.20) Dlaczego operacje, które wykonuje na duzych obiektach "large-object" zwracaja komunikat: "invalid large obj descriptor"? 4.21) Jak stworzyc kolumne której domyslna wartoscia bedzie biezacy czas? 4.22) Dlaczego zapytania uzywajace IN sa takie wolne? 4.23) Jak wykonac "outer join"? 4.24) Jak wykonywac zapytanie uzywajace kilku baz danych jednoczesnie? 4.25) Jak zwrócic w funkcji wiele rzedów lub kolumn? 4.26) Dlaczego nie moge w sposób pewny tworzyc/usuwac tabel tymczasowych w funkcjach PL/PgSQL? 4.27) Jakie sa mozliwosci replikacji w PostgreSQL? 4.28) Jakie mozliwosci szyfrowania oferuje PostgreSQL? Rozwijanie PostgreSQL 5.1) Napisal/em wl/asna funkcje. Kiedy uzyje jej w psql, program zrzuca pamiec (dump core)? 5.2) Jak moge dodac/zgl/osic nowe typy czy funkcje do PostgreSQL? 5.3) Jak napisac funkcje C zwracajaca krotke (tuple)? 5.4) Zmienil/em plik zródl/owy. Dlaczego po rekompilacji nie widac zmiany? _________________________________________________________________ Pytania ogólne 1.1) Co to jest PostgreSQL? Jak to wymawiac? PostgreSQL wymawia sie Post-Gres-kju-el. Czesto podczas rozmów uzywany jest termin "Postgres" PostgreSQL jest rozszerzeniem systemu zarzadzania bazami danych - POSTGRES, kolejna generacja rozwojowego prototypu DBMS. Mimo, ze PostgreSQL zachowal/ bardzo dobrze zbudowany model danych (data model) i bogaty zestaw typów danych POSTGRES'a, zastapil/ PostQuel'owy jezyk zapytan z rozbudowanym podzbiorem jezyka SQL. PostgreSQL jest oprogramowaniem darmowym z dostepnymi cal/ymi zródl/ami. Rozwój PostgreSQL jest prowadzony przez grupe ludzi z Internetu, komunikujacych sie poprzez mailowe listy dyskusyjne PostgreSQL. Obecnym koordynatorem jest Marc G. Fournier (scrappy@PostgreSQL.org). (Zobacz pytanie 1.6 jak sie przyl/aczyc). Ta grupa ludzi jest odpowiedzialna za cal/y rozwój PostgreSQL. PostgreSQL jest projektem nie kontrolowanym przez zadna firme, aby wziac udzial/ w jego rozwoju sprawdz, http://www.PostgreSQL.org/docs/faqs/FAQ_DEV.html Autorami PostgreSQL 1.01 byli Andrew Yu and Jolly Chen. Wiele innych osób pomogl/o przy portowaniu, testowaniu, debugowaniu i rozwijaniu kodu. Oryginalny kod Postgresa, na którym zostal/ oparty PostgreSQL, byl/ wysil/kiem studentów oraz pracowników pracujacych pod kierownictwem profesora Michael'a Stonebraker'a z University of California w Berkeley. Oryginalna nazwa oprogramowania w Berkeley byl/ Postgres. Po dodaniu obsl/ugi SQL w 1995, nazwa zostal/a zmieniona na Postgres95. Pod koniec roku 1996 nazwa zostal/a zmieniona na PostgreSQL. 1.2) Jaka licencja chroniony jest PostgreSQL? PostgreSQL objety jest nastepujaca licencja: PostgreSQL Data Base Management System Portions copyright (c) 1996-2002, PostgreSQL Global Development Group Portions Copyright (c) 1994-6 Regents of the University of California Permission to use, copy, modify, and distribute this software and its documentation for any purpose, without fee, and without a written agreement is hereby granted, provided that the above copyright notice and this paragraph and the following two paragraphs appear in all copies. IN NO EVENT SHALL THE UNIVERSITY OF CALIFORNIA BE LIABLE TO ANY PARTY FOR DIRECT, INDIRECT, SPECIAL, INCIDENTAL, OR CONSEQUENTIAL DAMAGES, INCLUDING LOST PROFITS, ARISING OUT OF THE USE OF THIS SOFTWARE AND ITS DOCUMENTATION, EVEN IF THE UNIVERSITY OF CALIFORNIA HAS BEEN ADVISED OF THE POSSIBILITY OF SUCH DAMAGE. THE UNIVERSITY OF CALIFORNIA SPECIFICALLY DISCLAIMS ANY WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE. THE SOFTWARE PROVIDED HEREUNDER IS ON AN "AS IS" BASIS, AND THE UNIVERSITY OF CALIFORNIA HAS NO OBLIGATIONS TO PROVIDE MAINTENANCE, SUPPORT, UPDATES, ENHANCEMENTS, OR MODIFICATIONS. Tekst powyzej, jest klasyczna licencja BSD. Nie posiada ona zadnych restrykcji co do uzywania kodu zródl/owego. Podoba nam sie i nie zamierzamy jej zmieniac. 1.3) Na jakich systemach Unixowych dzial/a PostreSQL? PostgreSQL powinien dzial/ac na wszystkich nowych Unix-podobnych systemach. Platformy, które zostal/y szczegól/owo przetestowane podczas publikowania PostgreSQL sa wymienione w dokumentacji opisujacej instalacje. 1.4) Na jakich nie-Unixowych systemach dzial/a PostgreSQL? Klient Mozliwa jest kompilacja bibliteki C libpq, psql oraz innych interfejsów i uruchamianie ich na platformie MS Windows. W tym wypadku klient jest uruchamiany na MS Windows a z serwerem komunikuje sie poprzez TCP/IP. Serwer moze dzial/ac na dowolnej wspieranej platformie Unixowej. Plik win32.mak jest dol/aczony do zródel/, aby mozna byl/o stworzyc biblioteke libpq oraz program psql dzial/ajace w srodowisku Win32. PostgreSQL moze sie takze komunikowac z klientami ODBC. Serwer Serwer moze byc uruchamiany na Windows NT i Win2k uzywajac bibliotek Cygwin, Cygnus Unix/NT. W pliku pgsql/doc/FAQ_MSWIN znajdujacym sie w zródl/ach lub pod adresem: http://www.PostgreSQL.org/docs/faqs/text/FAQ_MSWIN na naszych stronach. Obecnie prowadzone sa prace nad stworzeniem wersji dla MS Win NT/200/XP. Jesli chcesz sie dowiedziec o obecnym statusie tych prac zobacz http://techdocs.postgresql.org/guides/Windows and http://momjian.postgresql.org/main/writings/pgsql/win32.html. Istnieje takze port pod Novell Netware 6 dostepny pod adresem http://forge.novell.com. 1.5) Skad mozna sciagnac PostgreSQL? Gl/ówny serwer ftp z dostepem "anonymous" dla PostgreSQL znajduje sie ftp://ftp.PostgreSQL.org/pub. jesli szukasz mirrorów sprawdz nasza gl/ówna strone www. 1.6) Gdzie mozna szukac wsparcia technicznego? Adres gl/ównej listy mailowej: pgsql-general@PostgreSQL.org. Jest ona przeznaczona dyskusjom dotyczacym spraw zwiazanych z PostgreSQL. Zeby zapisac sie na liste, wyslij email z nastepujacymi liniami w tresci maila (nie w temacie): subscribe end na adres: pgsql-general-request@PostgreSQL.org. Dostepna jest takze lista wysyl/ajaca digesty. Aby zapisac sie na nia, wyslij email na adres: pgsql-general-digest-request@PostgreSQL.org z trescia maila zawierajaca: subscribe end Digesty sa wysyl/ane do czl/onków listy, kiedy na gl/ówna liste dotrze ok 30k wiadomosci. Dostepna jest takze lista poswiecona bl/edom znalezionym w PostgreSQL. Aby zapisac sie na nia wyslij email na adres: pgsql-bugs-request@PostgreSQL.org z trescia maila zawierajaca: subscribe end Lista poswiecona dyskusjom developerów jest dostepna pod adresem: pgsql-hackers-request@PostgreSQL.org Aby sie na nia zapisac wyslij na jej adres mail z trescia: subscribe end Dodatkowe informacje o listach mailowych dotyczacych PostgreSQL mozna znalezc na stronach WWW PostgreSQL pod adresem: http://www.PostgreSQL.org W sieci EFNet istnieje kanal/ IRC #PostgreSQL. Ja, do pol/aczenia sie z kanal/em uzywam Unixowego polecenia irc -c '#PostgreSQL' "$USER" irc.phoenix.net. Lista firm oferujacych wsparcie na zasadach komercyjnych znajduje sie pod adresem: http://techdocs.postgresql.org/companies.php. 1.7) Jaka jest ostatnia dostepna wersja? Ostatnia dostepna wersja PostgreSQL to 7.4.1. Planujemy publikowanie kolejnych wersji co szesc do osmiu miesiecy. 1.8) Jaka dokumentacja jest dostepna? Kilka manuali, stron podecznika man, oraz kilka przykl/adów do testowania sa zal/aczone w samej dystrybucji. Znajduja sie one w katalogu /doc. Manual moze byc takze przegladany poprzez strony www pod adresem http://www.PostgreSQL.org/docs. Istnieja takze dwie ksiazki dostepne online pod adresami http://www.PostgreSQL.org/docs/awbook.html i http://www.commandprompt.com/ppbook/. Lista ksiazek o PostgreSQL, które mozna kupic znajduje sie pod adresem http://techdocs.PostgreSQL.org/techdocs/bookreviews.php. Zbiór technicznych artykul/ów o PostgreSQL znajduje sie pod adresem http://techdocs.postgresql.org/. psql posiada kilka wbudowanych polecen \d, za pomoca których mozna sprawdzic informacje dotyczace typów, operatorów, funkcji, agregatów itd. Na naszej stronie mozna znalezc duzo wiecej dokumentacji. 1.9) Gdzie mozna znalezc informacje o znanych bl/edach czy brakujacych rozwiazanich? PostgreSQL wspiera rozszerzony podzbiór standardu SQL-92. Sprawdz nasza liste TODO aby znalezc informacje o znanych problemach, brakujacych rozwiazaniach czy przyszl/ych planach. 1.10) Jak moge sie nauczyc SQL? Ksiazka o PostgreSQL http://www.PostgreSQL.org/docs/awbook.html uczy SQL. Jest jeszcze inna ksiazka o PostgreSQL dostepna pod adresem: http://www.commandprompt.com/ppbook. Dobry tutorial mozesz znalezc pod adresem: http://www.intermedia.net/support/sql/sqltut.shtm, oraz http://ourworld.compuserve.com/homepages/graeme_birchall/HTM_COOK.HTM, i http://sqlcourse.com. Jeszcze inny to "Teach Yourself SQL in 21 Days, Second Edition" pod adresem: http://members.tripod.com/er4ebus/sql/index.htm Wielu z naszych uzytkowników poleca The Practical SQL Handbook, Bowman, Judith S., et al., Addison-Wesley. Inni polecaja The Complete Reference SQL, Groff et al., McGraw-Hill. 1.11) Czy PostgreSQL ma rozwiazany problem Y2K? Tak, bez problemu radzimy sobie z datami po roku 2000 AD, oraz przed rokiem 2000 BC. 1.12) Jak moge sie przyl/aczyc do grupy osób bezposrednio pracujacych nad rozwojem PostgreSQL? Przede wszystkim sciagnij ostatnie dostepne zródl/a i przeczytaj dokumentacje przeznaczona dla developerów na naszej stronie www lub dostepna takze w zródl/ach PostgreSQL. Nastepnie zapisz sie na listy mailowe pgsql-hackers i pgsql-patches. I na koniec, wysyl/aj nam wysokiej jakosci patch'e na liste pgsql-patches. Jest okol/o 12 osób, które maja uprawnienia do commit'owania w CVS PostgreSQL'a. Kazdy z nich submitowal/ tak wiele wysokiej jakosci patchy, ze stal/o sie niemozliwe dla obecnych commiterów byc z nimi na biezaco, wiec musielismy im ufac i miec pewnosc, ze ich poprawki sa wysokiej jakosci. 1.13) Jak moge zgl/aszac bl/edy? Zajrzyj na strone PostgreSQL BugTool, na której opisane sa wskazówki jak zgl/aszac informacje o bl/edach. Zajrzyj takze na nasz ftp ftp://ftp.PostgreSQL.org/pub, aby sprawdzic czy nie ma nowszych wersji PostgreSQL czy patchy. 1.14) Jak mozna porównac PostgreSQL w stosunku do innych DBMS? Jest kilka sposobów oceny softwaru: mozliwosci, wydajnosc, stabilnosc, wsparcie i cena. Mozliwosci PostgreSQL posiada mozliwosci dostepne w duzych, komercyjnych systemach DBMS, takie jak transakcje, podzapytania (subselects), triggery, widoki, klucze obce, referential integrity, oraz wyrafinowany system blokowania. Mamy takze wl/asciowsci których inni nie posiadaja, jak typy definiowane przez uzytkownika, dziedziczenie, rules, multi-version concurrency control, która redukuje problemy z blokowaniem (lock contention). Wydajnosc Wydajnosc PostgreSQL jest podobna do innych komercyjnych i open source baz danych. W niektórych sytuacjach jest szybszy w niektórych wolniejszy. W porównianiu do MySQL lub mniejszych baz danych jestesmy szybsi przy wielu uzytkownikach, skomplikowaych zapytaniach i duzym obciazeniu podczas. MySQL jest szybszy dla prostych SELECTów wykonywanych przez niewielu uzytkowników. Spowodowane jest to narzutem, który sie pojawia przy transakcjach. Oczywiscie MySQL nie ma wiekszosci z rozwiazan opisanych powyzej w sekcji Mozliwosci . PostgreSQL zostal/ stworzony z mysla o stabilnosci, oraz szerokiej gamie mozliwosci, ale mimo to staramy sie w kazdej wersji poprawiac jego wydajnosc. Ciekawe porównanie PostgreSQL i MySQL mozna znalezc pod adresem http://openacs.org/philosophy/why-not-mysql.html Dodatkowo, MySQL jest firma, która dystrybuuje jej produkty poprzez zasade Open Source i wymaga wykupienia licencji w przypadku tworzenia close-source software, co ie ma miejsca w przypadku PostgreSQL. Stabilnosc Zdajemy sobie sprawe, ze DBMS musi byc stabilny, w przeciwnym wypadku jest bez wartosci. Staramy sie publikowac kod stabilny, dobrze przetestowany, z minimum mozliwych bl/edów. Kazde wydanie poprzedza co najmniej miesiac testów wersji beta. Patrzac na historie wydan PostgreSQL widac, ze dostarczamy stabilne, dobrze sprawdzone wersje, które sa gotowe do uzycia w srodowisku produkcyjnym. Myslimy, ze proces publikowania kolejnych wersji opracowany przez nas jest jednym z lepszych wsród innych twórców oprogramowania bazodanowego. Wsparcie Dzieki naszym listom mailowym masz dostep do duzej liczby programistów i uzytkowników, którzy pomagaja rozwiazac kazdy napotkany problem. Chociaz nie mozemy gwarantowac znalezienia rozwiazania danego problemu, nie róznimy sie w tym od innych komercyjnych systemów DBMS. Bezposredni kontakt z programistami, uzytkownikami, dokumentacja i kodem zródl/owym sprawiaja, ze wsparcie oferowane PostgreSQL niejednokrotnie jest lepsze niz w innych systemach DBMS. Istnieje takze mozliwosc skorzystania z komercyjnego wsparcia dla tych, których takiego rozwiazania potrzebuja. (Sprawdz ten punkt FAQ.) Cena Korzystanie z PostgreSQL jest darmowe, zarówno w przypadku komercyjnym jak i niekomercyjnym. Mozesz korzystac z naszego kodu zródl/owego w Twoim produkcie bez zadnych ograniczen, poza tymi wymienionymi w licencji BSD przytoczonej powyzej. 1.15) W jaki sposób moge wesprzec finansowo PostgreSQL? PostgreSQL korzysta z najlepszej infrastruktury od samego poczatku istnienia projektu, czyli roku 1996 kiedy rozpoczelismy prace. Wszystko to zawdzieczamy Marc'owi Fournier'owi, który stworzyl/ ta infrastrukture i zarzadza nia od lat. Wysokiej jakosci infrastruktura jest bardzo wazna dla kazdego projektu open-source. Zapobiega przerwom w rozwoju projektu i jakimkolwiek przestojom. Oczywiscie korzystanie z wysokiej jakosci infrastruktury nie jest tanie. Istnieje wiele róznych miesiecznych, czy jednorazowych wydatków, które trzeba ponosic aby wszystko dzial/al/o jak nalezy. Jesli Ty, badz Twoja firma moze wspomóc finansowo rozwój PostgreSQL odwiedz adres: http://store.pgsql.com/shopping/ gdzie opisane jest jak to zrobic. Chociaz na stronie wspomniana jest nazwa PostgreSQL Inc, "datki" sa przeznaczone jedynie na rozwój projektu PostgreSQL i nie sa przeznaczane na finansowanie jakiejkolwiek firmy. Jesli wolisz, mozesz wysl/ac czek na adres kontaktowy. _________________________________________________________________ Jesli mozesz sie pochwalic udanymi wdrozeniami PostgreSQL, prosimy abys zgl/osil/ nam to na stronie: http://advocacy.postgresql.org. User Client Questions 2.1) Czy sa jakies driwery ODBC dla PostgreSQL? Dostepne sa dwa driwery ODBC: PsqlODBC i OpenLink ODBC. Mozesz pobrac PsqlODBC z adresu http://gborg.postgresql.org/project/psqlodbc/projdisplay.php OpenLink ODBC moze byc pobrany z adresu: http://www.openlinksw.com. Wspól/pracuje ze standardowym oprogramowaniem klienckim ODBC wiec w ten sposób mozesz korzystac z PostgreSQL ODBC dostepnego na kazdej pltaformie która wspiera (Win, Mac, Unix, VMS). Autorzy beda prawdopodobnie sprzedawac ten produkt osobom które wymagaja komercyjnego wsparcia, ale wersja darmowa bedzie zawsze dostepna. Wszystkie pytania mozesz wysyl/ac na adres: postgres95@openlink.co.uk. 2.2) Jakie istnieja narzedzia pozwalajace na dostep do PostgreSQL przez www? Dobry podrecznik dla poczatkujacych o dostepie do bazy danych przez www mozesz znalezc pod adresem: http://www.webreview.com Do integracji z www, swietnym rozwiazaniem jest PHP. Mozesz znalezc wiecej informacji na ten temat pod adresem http://www.php.net. Wiele osób w przypadku skomplikowanych rozwiazan uzywa Perl'a i modul/u CGI.pl lub mod_perl. 2.3) Czy istnieje jakies GUI dla PostgreSQL? Tak, istnieje kilka interfejsów graficznych dla PostgreSQL. Wsród nich PgAccess ( http://www.pgaccess.org), PgAdmin III (http://www.pgadmin.org), RHDB Admin (http://sources.redhat.com/rhdb/ ) oraz Rekall ( http://www.thekompany.com/products/rekall/, komercyjny). Istnieje takze PHPPgAdmin ( http://phppgadmin.sourceforge.net/ ), webowy interfejs dla PostgreSQL. Wiecej informacji na ten temat znajduje sie pod adresem See http://techdocs.postgresql.org/guides/GUITools. 2.4) Za pomoca jakich jezyków programowania mozna sie komunikowac z PostgreSQL? Najbardziej popularne jezyki posiiadaja wl/asny interfejs dla PostgreSQL. Sprawdz liste rozszerzen dla intersujacego Ciebie jezyka programowania. Ze zródl/ami PostreSQL dystrubuowane sa interfejsy dla nastepujacych jezyków programowania: * C (libpq) * Embedded C (ecpg) * Java (jdbc) * Python (PyGreSQL) * TCL (libpgtcl) Inne interfejsy sa dostepne pod adresem: http://gborg.postgresql.org w sekcji Drivers/Interfaces. _________________________________________________________________ Pytania dotyczace administracji 3.1) Jak moge zainstalowac PostgreSQL w innej lokalizacji niz /usr/local/pgsql? Uzyj opcji --prefix podczas uruchamiania skryptu configure. 3.2) Podczas startu postmaster'a, otrzymuje komunikat o bl/edzie: Bad System Call lub "core dumped". Dlaczego? Ten bl/ad moze byc wynikiem wielu problemów, ale na poczatek sprawdz czy masz zainstalowane rozszerzenia systemu V w jadrze systemu. PostgreSQL wymaga do pracy zainstalowanej obsl/ugi pamieci dzielonej i semaforów. 3.3) Podczas startu postmaster'a, otrzymuje komunikat o bl/edzie: IpcMemoryCreate. Dlaczego? Albo nie masz poprawnie skonfigurowanej obsl/ugi pamieci dzielonej w jadrze systemu, albo musisz zwiekszyc jej dostepny rozmiar. Dokl/adna ilosc jaka potrzebujesz jest zalezna od architektury systemu na jakim pracujesz, jak duzo buforów oraz jak duzo procesów backendu skonfigurowal/es dla postmaster'a. Dla wiekszosci systemów, z domyslna liczba buforów i procesów potrzebujesz minimum w przyblizeniu 1MB. Zobacz PostgreSQL Administrator's Guide gdzie szczegól/owo zostal/o opisane wykorzystanie pamieci dzielonej i semaforów. 3.4) Podczas startu postmaster'a, otrzymuje komunikat o bl/edzie: IpcSemaphoreCreate. Dlaczego? Jesli tresc bl/edu brzmi: IpcSemaphoreCreate: semget failed (No space left on device) oznacza to, ze jadro systemu nie jest skonfigurowane do obsl/ugi wystarczajacej liczby semaforów. Postgres wymaga jednego semafor'a na potencjalny jeden proces backend. Tymczasowym rozwiazaniem jest uruchomienie programu postmaster z mniejsza maksymalna liczba procesów backend. Uzyj opcji -N z parameterem mniejszym od domyslnego - 32. Bardziej trwal/ym rozwiazaniem jest zwiekszenie parametrów SEMMNS i SEMMNI jadra twojego systemu. Niedzial/ajace semafory moga spowodowac niepoprawne zamkniecie systemu w czasie intensywnego korzystania z bazy. Jesli tresc bl/edu jest inna, moze to oznaczac, ze obsl/uga semaforów nie zostal/a wl/aczona do jadra wcale. Zobacz PostgreSQL Administrator's Guide po bardziej szczegól/owe informacje o pamieci dzielonej i semaforach. 3.5) W jaki sposób moge kontrolowac pol/aczenia z innych hostów? Domyslnie PostgreSQL pozwala jedynie na pol/aczenia za pomoca socketów Unixowych z lokalnego hosta. Inne hosty nie beda mogl/y sie pol/aczyc z serwerem dopóki nie zostanie dodana opcja -i do postmaster'a, oraz nie umozliwi sie autoryzacji na podstawie adresu hostów modyfikujac odpowiednio plik $PGDATA/pg_hba.conf. To zmiany pozwola na pol/aczenia TCP/IP. 3.6) Jak powinienem skonfigurowac system baz danych aby uzyskac lepsza wydajnosc? Indeksy bez watpienia moga przyspieszyc wykonywanie zapytan. Polecenie EXPLAIN pozwala zobaczyc jak PostgreSQL interpretuje Twoje zapytanie i które indeksy sa uzywane. Jesli wykonujesz bardzo duzo INSERTów, moze warto je wykonac za pomoca jednego duzego pliku uzywajac polecenia COPY. Jest to duzo szybsze niz pojedyncze INSERTy. Po drugie polecenia SQL nie zawarte w bloku okreslajacym transakcje - BEGIN WORK/COMMIT, sa traktowane jako pojedyncza transakcja. Rozwaz wykonanie kilku polecen/zdan SQL w jednym bloku transakcji. To redukuje narzut nakl/adany przez transakcje. Przy duzych zmianach w danych, warto usunac i stworzyc na nowo indeksy. Jest kilka opcji pozwalajacych na poprawienie wydajnosci. Mozesz wyl/aczyc fsync() poprzez uruchomienie postmaster'a z opcjami -o -F. To spowoduje, ze fsync() nie bedzie zrzucal/ danych na dysk po kazdej transakcji. Mozesz takze uruchomic postmaster'a z opcja -B aby zwiekszyc wielkosc pamieci dzielonej uzywanej przez procesy backendów. Jesli ustawisz ta wartosc zbyt wysoko i przekroczysz limity ustawione przez kernel na pamiec dzielona, postmaster moze sie nie uruchomic. Kazdy bufor zajmuje 8K a domyslna ilosc buforów to 64. Mozesz takze uzyc opcji -S dla backendu aby zwiekszyc maksymalna wartosc pamieci uzywana przez proces backendu podczas sortowania. Opcja -S jest ustawiana wartoscia podawana w kilobajtach, domyslna wartosc to 512K. Mozesz takze uzyc polecenia CLUSTER aby pogrupowac dane w tabelach wg indeksu. Zobacz opis polecenia CLUSTER w manualu zeby dowiedziec sie wiecej. 3.7) Jakie sa mozliwosci wyszukiwania bl/edów? PostgreSQL ma kilka mozliwosci na raportowanie informacji o jego statusie, które moga byc przydatne przy debugowaniu procesu. Przede wszystkim uruchom skrypt configure z opcja --enable-cassert, wiele funkcji assert() monitoruja postep procesu backend i zatrzymuja program kiedy wydarzy sie cos nieoczekiwanego. Zarówno postmaster jak i postgres maja kilka opcji do debugowania. Za kazdym razem kiedy uruchamiasz postmaster'a, upewnij sie, ze wysyl/asz standardowe wyjscie i error do pliku z logami, np. w ten sposób: cd /usr/local/pgsql ./bin/postmaster >server.log 2>&1 & To utworzy plik server.log w gl/ównym katalogu PostgreSQL. Ten plik zawiera pozyteczne informacje o problemach i bl/edach, które wydarzyl/y sie podczas pracy serwera. Postmaster posiada opcje -d, która pozwala na raportowanie bardzo szczególowych informacji. Do opcji -d podajemy liczbe, która okresla szczegól/owosc wysyl/anych informacji. Musisz miec swiadomosc, ze wysoki poziom logowania bedzie powodowal/ tworzenie bardzo duzych plików z logami. Jesli postmaster nie zostal/ uruchomiony, mozesz uruchomic postgres'owy backend z linii polecen, i uruchomic Twoje polecenie SQL bezposrednio na nim. Taki sposób jest polecany jedynie w przypadku debugowania. Zwróc uwage, ze w tym wypadku zapytanie konczy znak nowej linii a nie srednik. Jesli skompilowal/es z opcjami debugowania mozesz uzyc debuggera aby sprawdzic co sie dzieje. Poniewz backend nie zostal/ uruchomiony przez postmaster'a, nie dzial/a w identycznym srodowisku, co oznacza ze powtórzenie warunków w jakich wystapil/y problemy moze byc problemem. Jesli postmaster dzial/a, uruchom psql w jednym z okien, nastepnie znajdz PID procesu postgres uzywanego przez psql. Uzyj debuggera aby do PID'u postgres'a. Mozesz ustawiac pul/apki (breakpoints) w debuggerze i wykonywac zapytania z psql. Jesli debugujesz uruchamianie postgres'a, mozesz ustawic zmienna PGOPTIONS="-W n", nastepnie uruchomic psql. Opcja ta pozwoli spowolnic uruchomienie na n sekund abys mógl/ sie pol/aczyc z procesem za pomoca debugera, ustawic jakiekolwiek pul/apki i kontynuowac proces uruchamiania. postgres moze byc uruchamiany z opcjami -s, -A i -t, które moga byc bardzo przydatne przy debuggowaniu i ocenie wydajnosci. Mozesz takze skompilowac z profilingiem aby zobaczyc jakie funkcje ile czasu wykonuja sie. Pliki profilowane dla backendu zostana umieszczone w katalogu pgsql/data/base/dbname. Pliki profilu klienta zostana umieszczone w biezacym katalogu klienta. Linux wymaga aby kompilowac z opcja -DLINUX_PROFILE aby profilowanie odbywal/o sie poprawnie. 3.8) Skad sie bierze komunikat: "Sorry, too many clients" podczas próby pol/aczenia sie z baza danych? Musisz zwiekszyc limit ilosci jednoczesnych procesów bacekendu dla procesu postmaster'a. Domyslny limit to 32 procesy. Mozesz go zwiekszyc przez restart postmaster z odpowiednia wartoscia ustawiana opcje -N w pliku postgresql.conf. Wez pod uwage, ze jesli zwiekszysz wartosc podana w opcji -N na wiecej niz 32 musisz takze zwiekszyc wartosc w opcji -B ponad jej domyslna wartosc 64; wartosc -B musi byc co najmniej dwa razy wieksza od wartosci podanej w opcji -N, a prawdopodobnie powinna byc w rzeczywistosci jeszcze wieksza dla optymalnej wydajnosci. Dla duzej liczby procesów backendu na pewno zauwazysz, ze trzeba zwiekszyc rózne parametry jadra Unixa. Rzeczy, które pownienes sprawdzic to maksymalna liczba bloków pamieci dzielonej, SHMMAX; maksymalna liczba semaforów, SEMMNS oraz SEMMNI; maksymalna liczba procesów, NPROC; maksymalna liczba procesów na jednego uzytkownika, MAXUPRC; i maksymalna liczba otwartych plików, NFILE oraz NINODE. Powód dla którego PostgreSQL ma limit na maksymalna liczbe procesów backendu to obawa o wyczerpanie zasobów systemu. 3.9) Jakie pliki znajduja sie w pg_temp? Katalog ten zawiera tymczasowe pliki utworzone przez executor. Dla przykl/adu, jesli jakas operacja sortowania jest wymagana do wykonania ORDER BY, a samo sortowanie wymaga wiecej miejsca niz parametr backendu -S ustawil/ do wykorzystania, wtedy tymczasowe pliki sa uzywane do przechowywania tych danych. Pliki tymczasowe powinny byc usuniete automatycznie, ale mogl/o sie to nie stac jesli proces backendu w miedzyczasie nie zakonczyl/ sie poprawnie podczas operacji sortowania. Jesli w danym momencie nie dzial/aja zadne procesy backendów mozesz spokojnie usunac pliki pg_tempNNN.NN. 3.9) Dlaczego konieczne jest przy upgradzie PostgreSQL korzystanie ze skryptów dump i restore? Twórcy PostgreSQL dokonuja jedynie mal/ych zmian pomiedzy mal/ymi upgradami wersji, np z 7.2 do 7.2.1, wtedy upgrade nie wymaga korzystania z dump i restore. Przy wiekszych zmianach, np. z wersji 7.2 do 7.3, czesto zmianymaja wpl/yw na format przechowywanych danych. Zmiany te sa na tyle skomplikowane, ze nie utrzymujemy zgodosci z poprzednimi wersjami PostgreSQL. dump pozwala na wydostanie danych w takiej postaci, w której l/atwe jest ich zaimportowanie do nowszych wersji bez kl/opotu. W wydaniach gdzie zmiany nie dotycza formatu danych na dysku, mozna wykorzystac skryptu pg_upgrade, do upgradu bez uzycia dump/restore. Dokumentacja do danego wydania zawiera informacje czy mozliwe jest uzycie pg_upgrade. _________________________________________________________________ Pytania dotyczace uzywania 4.1) Jaka jest róznica pomiedzy kursorami binarnymi (binary cursors) i zwykl/ymi kursorami (normal cursors)? Zobacz w manualu opis polecenia DECLARE. 4.2) Jak moge pobrac za pomoca SELECT jedynie kilka pierwszych wyników zapytania? Zobacz w manualu opis polecenia FETCH lub uzyj polecenia SELECT ... LIMIT.... Nawet jesli chesz pobrac kilka pierwszych rzedów z wyniku zapytania, cal/e zapytanie musi zostac wykonane. Byc moze powinienes skorzystac z polecenia ORDER BY. Jesli istnieje indeks który odpowiada polom okreslonym przez ORDER BY, PostgreSQL moze wykorzystac jedynie kilka pierwszych rzedów, byc moze bedzie koniecznosc wykonania zapytania do momentu az zostana znalezione pozadane wyniki. Aby otrzymac losowy rzad, uzyj: SELECT col FROM tab ORDER BY random() LIMIT 1; 4.3) Jak moge uzyskac liste wszystkich tabel czy innych rzeczy pod psql? Mozesz sprawdzic zawartosc zródel/ psql, a konkretnie plik pgsql/src/bin/psql/describe.c. Zawiera on polecenia SQL które generuja wyniki komend z backslashem. Mozesz takze uruchomic psql z opcja -E wtedy po wykonaniu polecenia z backslashem wyswietlane bedzie zapytanie, które w rzeczywistosci jest wykonywane. 4.4) Jak usunac kolumne z tabeli lub zmienic jej typ? DROP COLUMNT zostal/o dodane w wersji 7.3 przy poleceniu ALTER TABLE DROP COLUMN. We wczesniejszych wersjach mozesz zrobic tak: BEGIN; LOCAL TABLE old_table; SELECT ... -- wybierz wszystkie kolumny poza ta jedna której chcesz sie po zbyc INTO TABLE new_table FROM old_table; DROP TABLE old_table; ALTER TABLE new_table RENAME TO old_table; Aby zmienic typ danych kolumny mozesz zrobic tak: BEGIN; ALTER TABLE tab ADD COLUMN new_col new_data_type; UPDATE tab SET new_col = CAST(old_col AS new_data_type); ALTER TABLE tab DROP COLUMN old_col; COMMIT; 4.5) Jaki jest maksymalny rozmiar dla rzedu, tabeli i bazy danych? Oto wszystkie ograniczenia: Maksymalny rozmiar dla bazdy danych? nieograniczony ( istnieja bazy danych o wielkosci 32 TB databases ) Maksymalny rozmiar dla tabeli? 32 TB Maksymalny rozmiar dla rzedu? 1.6 TB Maksymalny rozmiar pola? 1 GB Maksymalna liczba rzedów w tabeli? nieograniczona Maksymalna liczba kolumn w tabeli? 250-1600 w zalezonosci od typów ko lumn Makasymalna liczba indeksów na tabeli? nieograniczona Oczywiscie "nieograniczony" nie jest prawda tak do konca, istnieja ograniczenia wynikajace z dostepnego miejsca na dysku, pamieci/swapa. Kiedy wielkosci te beda bardzo duze moze odbic sie to na wydajnosci. Maksymalny rozmiar tabeli, czyli 32 TB nie wymaga od systemu operacyjnego wsparcia dla duzych plików. Duze tabele sa przechowywane jako pliki o rozmiarze 1 GB, wiec ograniczenia co do wielkosci plików narzucone przez system plików nie sa istotne. Masymalny rozmiar tabeli i maksymalna liczba kolumn moze byc zwiekszona jesli zwiekszymy domyslny rozmiar bloku (block size) do 32k. 4.6) Jak duzo miejsca w bazie danych jest konieczne aby przechowywac dane ze zwyczajnego pliku tekstowego? Baza danych PostgreSQL moze potrzebowac do pieciu razy wiecej miejsca na przechowywanie danych z plików tekstowych niz ich objetosc. Jako przykl/ad mozemy rozwazyc plik skl/adajacy sie z 100,000 linii zbudowanych z liczby cal/kowitej oraz opisu tekstowego w kazdej. Zal/ózmy, ze srednio kazdy l/ancuch tekstu w linii zajmuje 20 bajtów. Cal/y plik powinien zajmowac ok. 2.8 MB. Rozmiar pliku bazy danych w PostgreSQL zawierajacego te dane mozna oszacowac na okol/o 6.4MB: 36 bajtów: nagl/ówek kazdego rzedu w przyblizeniu) 24 bajty: jedno pole int i jedno pole typu text + 4 bajty: wkaznik na stronie do krotki -------------------------------------------------- 64 bajty w jednym rzedzie Strona danych w PostgreSQL zajmuje 8192 bajtów (8 KB), wiec: 8192 bajtów na strone --------------------- = 128 rzedów na jedna strone w bazie (zaokraglone w dól/) 64 bajtów na rzad 100000 rzedów danych ----------------------- = 782 stron w bazie danych (zaokraglone w góre) 128 rzedów na strone 782 stron w bazie * 8192 bajtów na strone = 6,406,144 bajtów (6.4 MB) Indeksy nie powoduja duzego narzutu na zajmowane miejsce, ale zawieraja pewne dane, wiec w pewnych przypadkach moga byc cal/kiem duze. NULLe sa przechowywane jako mapy bitowe, wiec uzywaja bardzo mal/o miejsca. 4.7) Jak moge sprawdzic jakie tabele, klucze, bazy danych i uzytkownicy sa utworzeni? psql ma cal/kiem duza ilosc polecen z backslashem aby wydobyc takie informacje. Wprowadz \? aby zobaczyc ich spis. Istnieja takze tablice systemowe rozpoczynajace sie od pg_, zawierajace interesujace Ciebie informacje. Wykonanie psql -l pokaze spis wszystkich baz danych. Obejrzyj takze plik pgsql/src/tutorial/syscat.source. Zawiera on wiele z zapytan typu SELECT, które sa potrzebne aby wydobyc informacje z tablic systemowych. 4.8) Moje zapytania sa wolne lub nie uzywaja kluczy. Dlaczego? Indeksy nie sa uzywane automatycznie przez kazde z zapytan. Ideksy sa uzywane jedynie gdy tabela jest odpowiedniego rozmiaru, wiekszego niz wymagany minimalny, a zapytanie wybiera jedynie mal/y procent zawartosci tabeli. Wynika to z tego, ze losowy dostep do dysku powodowany przez ideksowane poszukiwanie jest czasami wolniejsze niz poszukiwanie sekwencyjne bez uzycia kluczy. Zeby zdecydowac czy indeks powinien byc uzywany, PostgreSQL musi miec statystyki dotyczace danej tabeli. Sa one gromadzone przez uzycie polecenia VACUUM ANALYZE, lub poprostu ANALYZE. uzywajac statystyk, optymalizator wie ile rzedów jest w tabeli i moze lepiej okreslic czy indeksy powinny byc uzyte. Statystyki moga byc takze pomocne w okresleniu najlepszej kolejnosci wykonania zl/aczenia (join) i jego sposobu. Gromadzenie statystyk powinno sie odbywac w okreslonych interwal/ach czasu poniewaz dane w tabelach zmieniaja sie. Indeksy nie sa zazwyczaj uzywane przez ORDER BY lub przy wykonywaniu zl/aczen (join). Sekwencyjne przeszukiwanie po którym nastepuje sortowanie jest zazwyczaj szybsze nie wyszukiwanie za pomoca indeksu na duzej tabeli. Jakkolwiek LIMIT w pol/aczeniu z ORDER BY czesto bedzie wykorzystywal/ indeksy poniewaz jedynie mal/a czesc z tabeli jest zwracana. W rzeczywistosci, chociaz MAX() i MIN() nie uzywaja indeksów, mozliwe jest aby zwrócic te wartosci uzywajac indeksów poprzez uzycie ORDER BY i LIMIT. SELECT col FROM tab ORDER BY col [ DESC ] LIMIT 1; Jesli uwazasz, ze optimizer myli sie wybierajac sequential scan, uzyj SET enable_seqscan TO 'off' i uruchom testy aby sprawdzic czy wtym wypadku zapytanie bedzie szybciej wykonywane. Kiedy uzywa sie operatorów dopasujacych takich jak LIKE lub ~, indeksy beda uzywane jedynie w pewnych wypadkach: * Poczatek wyszukiwania jest oparty na poczatku l/ancucha tekstu. + wzorce LIKE nie moga sie zaczynac % + dopasowania operatorem ~ (dopasowania regularne) musza sie zaczynac znakiem specjalnym ^. * Poczatek wyszukiwania nie moze sie zaczynac od klas znaków, np. [a-e]. * Case-insensitive searches such as ILIKE and ~* do not utilise indexes. Instead, use functional indexes, which are described in section 4.12. * Standardowe locale C musi byc uzyte przy wykonywaniu initdb 4.9) Jak moge sprawdzic w jakis sposób "query optimizer" wykonuje moje zapytanie? Zobacz manual dla polecenia EXPLAIN. 4.10) Co to jest "R-tree index"? Indeks R-tree jest uzywany do indeksowania danych przestrzennych. Indeks hasuujacy nie nadaje sie do wyszukiwania odlegl/osci. Natomiast indeks typu B-tree moze wyszukiwac odleglosci jedynie w jednowymiarowych przestrzeniach. R-tree indeks radzi sobie z przestrzeniami wielo-wymiarowymi. Dla przykl/adu, jesli zostanie zal/ozony indeks typu R-tree na polu typu point, system moze bardziej wydajnie odpowiadac na zapytania typu "select all points within a bounding rectangle." Zródl/owym dokumentem opisujacym oryginalnie projektowanie R-tree indeksów jest: Guttman, A. "R-trees: A Dynamic Index Structure for Spatial Searching." Proceedings of the 1984 ACM SIGMOD Int'l Conf on Mgmt of Data, 45-57. Ten dokument mozesz znalezc takze w pracy Stonebraker'a "Readings in Database Systems". Wbudowane indeksy R-trees radza sobie w wielobokami i boxes. Teoretycznie, indeksy R-tree moga byc rozszerzone o mozliwosci indeksowania w wiecej wymiarowych przestrzeniach. W praktyce, rozbudowa indeksów R-tree wymaga troche pracy, a w tej chwili nie dysponujemy jakakolwiek dokumentacja jak to zrobic. 4.11) Co to jest "Genetic Query Optimizer"? Modul/ GEQO ma za zadanie przyspieszenie optymalizacji zapytan l/aczac wiele tabel za pomoca algorytmów genetycznych (Genetic Algorithm (GA)). Pozwala na uzywanie duzych zapytan l/aczacych tabele (join queries) bez wykorzystywania zasobozernego wyszukiwania. 4.12) Jak moge uzywac wyrazen regularnych w zapytaniach i zapytan case-insensitive w wyrazeniach regularnych? Jak korzystac z indeksów dla zapytan case-insensitive? Operator ~ moze byc wykorzystywany do wyszukiwania za pomoca wyrazen regularnych, a ~* do wyszukiwania case-insensitive z wyrazeniami regularnymi. Wariant case-insensitive dla LIKE zostal/ nazwany ILIKE. Porównania case-insensitive sa zazwyczaj wykonywane w nastepujacy sposób: SELECT * FROM tab WHERE lower(col) = 'abc' W tym wypadku standardowe indeksy nie beda uzywane. Mozesz utworzyc indeks funkcyjny, poprzez: CREATE INDEX tabindex on tab (lower(col)); 4.13) Jak sprawdzic w zapytaniu czy pole ma wartosc NULL? Mozesz to sprawdzic, testujac wartosc kolumny warunkiem IS NULL albo IS NOT NULL. 4.14) Jaka jest róznica pomiedzy róznymi typami tekstowymi (character types)? Type Nazwa wewnetrzna Uwagi -------------------------------------------------- VARCHAR(n) varchar rozmiar okresla maksymalna dl/ugosc, nie ma tutaj wypel/niania CHAR(n) bpchar wypel/niane pustymi znakami do podanej dl/ug osci TEXT text bez limitu na dl/ugosc l/ancucha BYTEA bytea zmiennej dl/ugosci tablica bajtów (null-byte safe) "char" char 1 znak Jesli bedziesz przegladac katalogi systemowe lub komunikaty o bl/edach czesto spotkasz sie z podanymi powyzej nazwami wewnetrznymi. Pierwsze cztery typy powyzej to tzw typy "varlena" (np. pierwsze cztery bajty na dysku to dl/ugosc, po których jest data). Dlatego faktyczna dl/ugosc takiego l/ancucha jest troche wieksza niz zadeklarowany rozmiar. Te typy takze podlegaja kompresji lub moga byc przechowywane out-of-line jako TOAST, wiec faktyczne zuzycie miejsca na dysku moze byc mniejsze niz oczekiwane. VARCHAR(n) jest najodpowiedniejszy do przechowywania l/ancuchów o róznej dl/ugosci ale okresla on maksymalna jego dl/ugosc. TEXT jest najlepszy dla l/ancuchów o dowolnej dl/ugosci, nie przekraczajacej 1GB. CHAR(n) jast najlepszym typem do przechowywania l/ancuchów o tej samej dl/ugosci. CHAR(n) wypel/nia dane do zadanej dl/ugosci, podczas gdy VARCHAR(n) przechowuje jedynie dane dostarczone. BYTEA sl/uzy do przechowywania danych binarnych, w szczególnosci dla danych zawierajacych NULL bajty. Wszystkie typy opisane tutaj maja podobne charakterystyki jesli chodzi o wydajnosc. 4.15.1) Jak moge utworzyc pole które samo zwieksza swoja wartosc? PostgreSQL ma zaimplementowany typ SERIAL. Automatycznie tworzy sekwencje i indeks na tej kolumnie. Dla przykladu: CREATE TABLE person ( id SERIAL, name TEXT ); zostanie automatycznie prztl/umaczone na: CREATE SEQUENCE person_id_seq; CREATE TABLE person ( id INT4 NOT NULL DEFAULT nextval('person_id_seq'), name TEXT ); CREATE UNIQUE INDEX person_id_key ON person ( id ); Wiecej informacji o sekwencjach znajdziesz w manualu o create_sequence. Mozesz takze uzyc pola OID jako unikalnej wartosci dla kazdego rzedu danych. Jesli bedziesz potrzebowal/ z backupowac dane robiac dump bazy i odtworzyc ja, musisz uzyc pg_dump z opcja -o lub polecenia COPY WITH OIDS aby zachowac OIDy. 4.15.2) Jak pobrac wartosc pola typu SERIAL po wykonaniu insert'u? Jednym z podejsc jest pobranie kolejnej wartosci typu SERIAL z sekwencji za pomoca funkcji nextval() zanim zostanie wstawiona, a pózniej nalezy jej uzyc. Uzywajac przykl/adu z tabeli z punktu 4.15.1, moze to wygladac w Perlu na przykl/ad w ten sposób: new_id = output of "SELECT nextval('person_id_seq')" INSERT INTO person (id, name) VALUES (new_id, 'Blaise Pascal'); Bedziesz mial/ wtedy ta wartosc przechowana w zmiennej new_id do uzytku w innych zapytaniach (np. jako klucz obcy do tabeli person). Warto zwrócic uwage, ze nazwa automatycznie utworzonej sekwencji SEQUENCE bedzie nastepujaca: __seq, gdzie tabela i kolumnatypuserial sa nazwami Twojej tabeli i Twojej kolumny typu SERIAL. Inne rozwiazanie to uzycie funkcji currval() na pola typu SERIAL po dodaniu nowej wartosci do rzedu zawierajacego kolumne typu SERIAL z wstawiona domyslnie wartoscia, np. INSERT INTO person (name) VALUES ('Blaise Pascal'); new_id = output of "SELECT currval('person_id_seq')"; Ostatecznie mozesz uzyc OID zwracanej po wykonaniu INSERT, chociaz to jest najmniej przenosne rozwiazanie. W Perlu, wykorzystujac biblioteke DBI z modul/em Edmunda Mergla DBD::Pg, oid jest dostepny poprzez $sth->{pg_oid_status} po wykonaniu $sth->execute(). 4.15.3) Czy uzycie currval() i nextval() nie doprowadzi do race condition z innymi uzytkownikami? Nie. currval() zwraca biezaca wartosc przypisana przez Twój backend, a nie przez wszystkich uzytkowników. 4.15.4) Dlaczego numery sekwencji nie sa ponownie uzywane przy przerwaniu transakcji? Skad sie biora luki w numerowaniu kolumny tabeli sekwancjami/SERIALem? Aby poprawic zbieznosc (concurrency), wartosci sekwencji sa podawane dzial/ajacym transakcjom kiedy tego potrzebuja i nie sa blokowane dopóki transakcja sie nie zakonczy. To spowoduje przerwy w numerowaniu z przerwanych transakcji. 4.16) Co to jest OID? Co to jest TID? OID sa PostgreSQL'owym rozwiazaniem problemu unikalnych numerów rzedów. Kazdy rzad tworzony przez PostgreSQL otrzymuje unikalny OID. Wszystkie OIDy generowane podczas procesu uruchamianego przez skrypt initdb maja mniejsza wartosc niz 16384 (na podstawie pliku backend/access/transam.h). Wszystkie OIDy tworzone przez uzytkownika sa równe lub wieksze podanej wczesniej wartosci. Domyslnie wszystkie OIDy sa unikalne nie tylko w pojedynczej tabeli czy bazie danych ale w cal/ej instalacji PostgreSQL. PostgreSQL uzywa OIDów w swoim wewnetrznym systemie tabel, aby mozna byl/o je l/aczyc. Te OIDy moga byc uzywane aby identyfikowac rzedy w tabelach i wykorzystywac je w zl/aczeniach tych tabel. Zaleca sie abys uzywal/ typu OID aby przechowywac wartosci OID. Mozesz utworzyc indeks na polu OID aby dostep do niego byl/ szybszy. OID sa przypisane do wszystkich rzedów z jednego gl/ównego miejsca i uzywane sa przez wszystkie bazy danych. Jesli chcial/bys zmienic OID na cos innego, lub jesli chcial/bys zrobic kopie tabeli, z orginalnymi OIDami nie ma zadnego przeciwwskazania abys to zrobil/: CREATE TABLE new_table(old_oid oid, mycol int); SELECT old_oid, mycol INTO new FROM old; COPY new TO '/tmp/pgtable'; DELETE FROM new; COPY new WITH OIDS FROM '/tmp/pgtable'; OIDy sa przechowywane jako cztero-bajtowe liczby cal/kowite i skoncza sie po osiagnieciu czterech miliardów. Nikt jak dotad nie zgl/osil/ aby cos takiego sie stalo, ale mamy zamiar pozbyc sie tego ograniczenia zanim ktos to zgl/osi. TID sa uzywane aby zidentyfikowac konkretne rzedy z blokami i wartoscia ofsetów. TIDy zmieniaja sie wraz ze zmianami rzedów. Sa uzywane przez indeksy, aby wskazywac do fizycznych rzedów. 4.17) Jakie jest znaczenie niektórych terminów w PostgreSQL? W czesci kodu zródl/owego i starszej dokumentacji uzywamy terminów, które maja bardziej ogólne znaczenie. Oto niektóre z nich: * table, relation, class * row, record, tuple * column, field, attribute * retrieve, select * replace, update * append, insert * OID, serial value * portal, cursor * range variable, table name, table alias Liste terminów zwiazanych z bazami danych mozesz znalezc pod tym adresem:http://hea-www.harvard.edu/MST/simul/software/docs/pkgs/pgsql/ glossary/glossary.html. 4.18) Skad bierze sie ten bl/ad "ERROR: Memory exhausted in AllocSetAlloc()"? Prawdopodobnie wyczerpal/a Ci sie pamiec wirtualna (virtual memory) w systemie lub Twój kernel ma zbyt nisko ustawione limity dla pewnych zasobów. Spróbuj wykonac nastepujace polecenia zanim uruchomisz postmaster'a: ulimit -d 262144 limit datasize 256m W zaleznosci od shell'a jakiego uzywasz jedno z tych polecen moze nie zadzial/ac, ale to ustawienie pozwoli ustawic segment danych dla procesu znacznie wiekszy i byc moze pozwoli wykonac zapytanie. To polecenie zadzial/a dla biezacego procesu oraz wszytkich podprocesów utworzonych po wykonaniu polecenia. Jesli ten problem wystepuje z klientem SQL, poniewaz backend zwraca zbyt duzo danych, spróbuj wykonac to polecenie przed uruchomieniem klienta. 4.19) Jak sprawdzic jakiej wersji PostgreSQL uzywam? W psql, wpisz select version(); 4.20) Dlaczego operacje, które wykonuje na duzych obiektach "large-object" zwracaja komunikat: "invalid large obj descriptor"? Musisz uzyc BEGIN WORK i COMMIT przed i po uzyciu uchwytu do duzego obiektu, tzn. musisz nimi otoczyc funkcje lo_open ... lo_close. Obecnie PostgreSQL uzywjac "rule" zamyka uchwyt do duzego obiektu przy kazdym wywol/aniu "commit". Wiec pierwsze próba zrobienia czegokolwiek z uchwytem spowoduje wypisanie: invalid large obj descriptor. Kod, który do tej pory dzial/al/ (przynajmniej wiekszosc razy) bedzie teraz generowal/ informacje o bl/edzie jesli nie bedziesz korzystal/ z transakcji. Jesli uzywasz interfejsu klienta jak ODBC byc moze bedziesz musial/ ustawic auto-commit off. 4.21) Jak stworzyc kolumne której domyslna wartoscia bedzie biezacy czas? Uzyj CURRENT_TIMESTAMP: CREATE TABLE test (x int, modtime timestamp DEFAULT CURRENT_TIMESTAMP ); 4.22) Dlaczego zapytania uzywajace IN sa takie wolne? W wersjach wczesniejszych niz 7.4 l/aczymy podzapytania w outer queries poprzez sekwencyjne przeszukiwanie wyników podzapytania dla kazdego rzedu z outer query. Jesli podzapytanie zwraca jedynie kilka rzedów a zewnetrzne zapytanie zwraca ich wiele, IN jest najszybsze. Aby przyspieszyc inne zapytania mozna zastapic IN przez EXISTS: SELECT * FROM tab WHERE col IN (SELECT subcol FROM subtab) na: SELECT * FROM tab WHERE EXISTS (SELECT subcol FROM subtab WHERE subcol = col) Aby to rozwiazanie byl/o szybkie, subcol powinna byc kolumna indeksowana. W wersji 7.4 i pózniejszych, IN w rzeczywistosci uzywa tej samej wyrafinowanej techniki l/aczenia jak normalne zapytania i jest preferowane nad uzywaniem EXISTS. 4.23) Jak wykonac "outer join"? PostgreSQL ma zaimplementowane outer join wykorzystujac standardowa skl/adnie SQL. Ponizej dwa przykl/ady: SELECT * FROM t1 LEFT OUTER JOIN t2 ON (t1.col = t2.col); or SELECT * FROM t1 LEFT OUTER JOIN t2 USING (col); Te dwa identyczne zapytania l/acza kolumne t1.col z kolumna t2.col, ale takze zwróca niepol/aczone rzedy w t1 (te, które nie pasuja w t2). RIGHT join dodal/by niepol/aczone rzedy z tabeli t2. FULL join zwrócil/by rzedy plus dodatkowo wszystkie rzedy z tabel t1 i t2. Sl/owo OUTER jest opcjonalne i jest dodawane domyslnie przy LEFT, RIGHT, i FULL join'ach. Zwykl/e join'y sa nazywane INNER joins. W poprzednich wersjach "outer joins" moga byc zasymulowane poprzez uzycie slowa kluczowego UNION i NOT IN. Dla przykl/adu, l/aczac tabele tab1 i tab2, nastepujace zapytanie wykonuje outer join: SELECT tab1.col1, tab2.col2 FROM tab1, tab2 WHERE tab1.col1 = tab2.col1 UNION ALL SELECT tab1.col1, NULL FROM tab1 WHERE tab1.col1 NOT IN (SELECT tab2.col1 FROM tab2) ORDER BY col1 4.24) Jak wykonywac zapytanie uzywajace kilku baz danych jednoczesnie? Nie ma takiej mozliwosci aby w zapytaniu odpytawac inna baze danych poza biezaca. Poniewaz PostgreSQL l/aduje specyficzne dla bazy danych katalogi systemowe, nie jest do konca jasne jak zapytanie pomiedzy róznymi bazami danych powinno sie zachowywac. contrib/dblink pozwala na wykonywanie zapytan poprzez rózne bazy danych wywol/ujac odpowiednie funkcje. Oczywiscie klient moze l/aczyc sie z róznymi bazami danych i l/aczyc informacje w ten sposób uzyskana po stronie klienta. 4.25) Jak zwrócic w funkcji wiele rzedów lub kolumn? Mozesz w l/atwy sposób zwracac wiele rzedów lub kolumn uzywajac funkcji z: http://techdocs.postgresql.org/guides/SetReturningFunctions. 4.26) Dlaczego nie moge w sposób pewny tworzyc/usuwac tabel tymczasowych w funkcjach PL/PgSQL? PL/PgSQL przechowuje w cache zawartosc funkcji, niepozadanym efektem tego jest to, ze gdy taka funkcja korzysta z tabel tymczasowych, które sa pózniej kasowane i odtwarzane, a funkcja wywol/ywana jest ponownie,jej wywol/anie nie powiedzie sie poniewaz cachowana funkcja wciaz bedzie wskazywac na stara tablice tymczasowa. Rozwiazaniem tego problemu jest uzywanie EXECUTE aby korzystac z tabel tymczasowych w PL/PgSQL. To spowoduje, ze zapytanie bedzie parsowane przy kazdym wywol/aniu funkcji. 4.27) Jakie sa mozliwosci replikacji w PostgreSQL? Jest kilka opcji aby stosowac replikacje typu master/slave. Ten typ pozwala jedynie masterowi na dokonywanie zmian w bazie danych, a slave moze jedynie te zmiany odczytywac. Na stronie http://gborg.PostgreSQL.org/genpage?replication_research znajduje sie ich lista. Replikacja typu multi-master jest w trakcie prac, opis projektu znajduje sie pod adresem: http://gborg.PostgreSQL.org/project/pgreplication/projdisplay.php. 4.28) Jakie mozliwosci szyfrowania oferuje PostgreSQL? * contrib/pgcrypto zawiera wiele funkcji za pomoca, których mozemy uzywac kryptografii w zapytaniach SQL. * Aby szyfrowac transmisje od klienta do serwera, ten musi miec ustawiona opcje ssl na true w pliku postgresql.conf, odpowiedni wpis host lub hostssl musi wystepowac w pliku pg_hba.conf, oraz sslmode nie moze byc wyl/aczone w kliencie. (Warto zwrócic uwage, ze mozliwe jest takze uzywanie transportów szyfrujaców przez strony trzecie, takie jak stunnel lub ssh, poza natywnym wsparciem dla SSL przez PostgreSQL). * Hasl/a uzytkowników bazy danych sa automatycznie szyfrowane od wersji 7.3. W poprzednich wersjach, nalezy ta funkcjonalnosc poprzez wl/aczenie opcji PASSWORD_ENCRYPTION w postgresql.conf. * Serwer moze dzial/ac uzywajac szyfrowanego systemu plików. Rozwijanie PostgreSQL 5.1) Napisal/em wl/asna funkcje. Kiedy uzyje jej w psql, program zrzuca pamiec (dump core)? Problem moze byc spowodowany przez bardzo wiele rzeczy. Spróbuj najpierw przetestowac Twoja funkcje w samodzielnie dzial/ajacym programie. 5.2) Jak moge dodac/zgl/osic nowe typy czy funkcje do PostgreSQL? Wyslij Twoje propozycje na liste mailowa pgsql-hackers, wtedy prawdopodobnie Twój kod znajdzie sie w katalogu contrib/. 5.3) Jak napisac funkcje C zwracajaca krotke (tuple)? W wersjach PostgreSQL od numeru 7.3, funckje zwracajace tabele sa w pelni wspierane w C, PL/PgSQL i SQL. Sprawdz w Programmer's Guide aby uzyskac wiecej informacji. Przykl/ad funkcji napisanej w C zwracajacej tabele zostal/ umieszczony w contrib/tablefunc. 5.4) Zmienil/em plik zródl/owy. Dlaczego po rekompilacji nie widac zmiany? Pliki Makefiles nie maja dorzuconych odpowiednich zaleznosci dla plików nagl/ówkowych (include files). Wykonaj najpierw make clean, a nastepnie ponownie make. Jesli uzywasz GCC mozesz uzyc opcji --enable-depend przy wykonywaniu configure aby kompilator mógl/ okreslic zaleznosci samodzielnie.