Czym jest JSON
JSON (ang. JavaScript Object Notation) to format zapisu i wymiany danych. Jest to format tekstowy. Uważany jest za format czytelny zarówno dla maszyn jak i dla ludzi.
Dane formatowane przy użyciu JSON mogą być określane się jako application/json
. Ta wartość może być zawarta w nagłówkach HTTP określając typ akceptowanych/wysyłanych danych.
Poniżej możesz zobaczyć prawidłowy dokument w formacie JSON:
{
"timestamp" : 1536731522,
"event_type" : "jump-to-menu-activation",
"measures" : {
"filter_count" : 77,
"result_count" : 25,
"display_count" : 7
},
"dimensions" : {
"query" : "test",
"actor_id" : 73585,
"session_id" : "b5c50e56-75ce-50cb-9d44-7cbba93b00e5",
"display_set" : [
[
"Repository",
106327483
],
[
"Repository",
42456996
]
]
}
}
To co widzisz powyżej to część zapytania, które wysyłane jest w trakcie wyszukiwania na Github’ie. W momencie wpisywania czegokolwiek w wyszukiwarkę strona wysyła zapytanie, którego ciało jest w formacie JSON. Fragment powyżej zawiera obiekt, który ma 4 atrybuty:
timestamp
, którego wartością jest liczba,event_type
, którego wartością jest łańcuch znaków,measures
idimensions
, których wartościami są inne obiekty.
W związku ze swoją prostotą JSON nie wspiera przestrzeni nazw (ang. namespace). Weryfikacja schematu dokumentu możliwa jest przy użyciu dodatkowych narzędzi: JSON Schema lub JSchema. JSON często porównywany jest z formatem XML gdzie zarówno schemat jak przestrzenie nazw są wspierane. Faktem jest, że format JSON zawojował Internet. Stało się tak między innymi dzięki popularności języka JavaScript, z którego ten format się wywodzi.
Opis formatu JSON
JSON to bardzo prosty format zapisu/wymiany danych. Specyfikacja formatu JSON to jedna z przyjemniejszych specyfikacji jakie czytałem, jest przyjemna bo zawiera jedynie 5 stron tekstu ;). W formacie występuje sześć symboli, które określają strukturę dokumentu:
{
i}
,[
i]
,:
,,
.
W formacie tym występują tylko trzy “słowa kluczowe”, literały:
true
,false
,null
.
Białe znaki (tabulator, znak nowej linii1 czy spacja) są ignorowane. Zatem dwa poniższe dokumenty JSON są równoważne:
{
"coś": "jeszcze coś"
}
{"coś":"jeszcze coś"}
Wspierane typy danych
Łańcuch znaków
Łańcuchy znaków jakie są każdy widzi ;). Łańcuch znaków to ciąg znaków otoczony "
. Dodatkowo znak \
pozwala na wprowadzenie znaków specjalnych. Na przykład \"
oznacza cudzysłów, a \
ukośnik. Kilka przykładowych wartości:
"some value"
,"zażółć gęślą jaźń"
,"true"
,"\\""
, reprezentuje łańcuch znaków\"
.
Obiekt
Element tego typu składa się z nawiasów {
i }
. Wewnątrz nawiasów umieszczone są pary w postaci: "nazwa atrybutu": <wartość atrybutu>
. <wartość atrybutu>
może być dowolną wspieraną wartością. Nazwa atrybutu przedstawiona jest jako łańcuch znaków. Pary oddzielone są od siebie ,
. Kolejność par nie ma znaczenia. Specyfikacja nie narzuca unikalności kluczy2.
{
"attribute": "value",
"other attribute": 123
}
Lista
Element tego typu grupuje uporządkowaną listę wartości. Składa się on z nawiasów [
i ]
. Wewnątrz nich znajdują się wartości oddzielone ,
. Wartości wewnątrz listy mogą być różnych typów3:
[1, true, "true"]
Liczba
Liczby w formacie JSON to ciąg cyfr. Opcjonalnie poprzedzony znakiem -
. Do oddzielenia części ułamkowej od całkowitej służy .
. Notacja naukowa jest dopuszczalna. Oto kilka prawidłowych liczb w formacie JSON:
123
,123.123
,-123
,1.23123e2
,1.23123E-2
.
Literały
W formacie JSON występują trzy literały:
true
– reprezentuje wartość logiczną – prawdę,false
– reprezentuje wartość logiczną – fałsz,null
– reprezentuje wartość pustą, brak wartości.
Element główny
Specyfikacja formatu JSON nie narzuca typu elementu głównego. Oznacza to tyle, że zgodnie ze specyfikacją poniższe dokumenty są poprawne:
[1, 2, 3]
true
"some string"
Mimo braku takiego wymogu przyjęło się, że elementem głównym dokumentu w tym formacie zawsze jest obiekt. Poniżej znajdziesz “poprawną” reprezentację przykładów, które przytoczyłem wyżej:
{
"x": [1, 2, 3]
}
{
"y": true
}
{
"z": "some string"
}
JSON-P
Wszystkie fragmenty kodu użyte w tym artykule udostępnione są na Samouczkowym Githubie. Zachęcam Cię do eksperymentów i uruchomienia kodu samodzielnie.
Zwróć też uwagę na zależności wspomniane w pliku build.gradle
. Część klas użytych we fragmentach poniżej nie jest dostępna w standardowej bibliotece Javy.
JSON-P jest specyfikacją, która opisuje przetwarzanie formatu JSON. Zakłada przetwarzanie dokumentów JSON zarówno w całości jak i w trybie strumieniowym (nie trzeba załadować całego dokumentu do pamięci). Pozwala na parsowanie i generowanie dokumentów w formacie JSON. Specyfikacja JSON-P 1.1 jest częścią JEE 8.
Tryb “obiektowy”
Decydując się na tryb obiektowy musisz zbudować cały obiekt przed przekształcaniem go do formatu JSON.
Zapis
Tworzenie instancji klas odpowiadających typom formatu JSON polega na wywołaniu odpowiednich metod udostępnionych przez klasy JsonArrayBuilder
i JsonObjectBuilder
. Instancje tych klas tworzone są przez JsonBuilderFactory
. Proszę spójrz na przykład poniżej:
JsonBuilderFactory builderFactory = Json.createBuilderFactory(Collections.emptyMap());
JsonObject publicationDateObject = builderFactory.createObjectBuilder()
.add("rok", 2018)
.add("miesiąc", 9)
.add("dzień", 13).build();
System.out.println(publicationDateObject.toString());
W przykładzie tym tworzę obiekt, który ma trzy atrybuty: rok
, miesiąc
i dzień
. Po uruchomieniu takiego fragmentu kodu na konsoli wyświetli się dokument w formacie JSON:
{"rok":2018,"miesiąc":9,"dzień":13}
Bardziej skomplikowany przykład możesz zobaczyć poniżej. Używam w nim dokładnie tego samego API łącząc ze sobą różne obiekty. W wyniku działania tego kodu powstaje zagnieżdżona struktura obiektów:
JsonBuilderFactory builderFactory = Json.createBuilderFactory(Collections.emptyMap());
JsonObject publicationDateObject = builderFactory.createObjectBuilder()
.add("rok", 2018)
.add("miesiąc", 9)
.add("dzień", 13).build();
JsonObject articleObject = builderFactory.createObjectBuilder()
.add("tytuł", "Format JSON w języku Java")
.add("data publikacji", publicationDateObject).build();
JsonArray articlesArray = builderFactory.createArrayBuilder().add(articleObject).build();
JsonObject webPageObject = builderFactory.createObjectBuilder()
.add("adres www", "https://www.samouczekprogramisty.pl")
.add("artykuły", articlesArray).build();
JsonObject authorObject = builderFactory.createObjectBuilder()
.add("imię", "Marcin")
.add("nazwisko", "Pietraszek")
.add("strona", webPageObject).build();
Tym razem użyję trochę innej metody wypisywania obiektu. Tworząc instancję JsonWriterFactory
mogę przekazać konfigurację. Konfiguracja wpływa na zachowanie tej klasy.
Map<String, ?> config = Collections.singletonMap(JsonGenerator.PRETTY_PRINTING, true);
JsonWriterFactory writerFactory = Json.createWriterFactory(config);
writerFactory.createWriter(System.out).write(authorObject);
Dzięki takiemu podejściu wynik wypisywany na konsoli jest sformatowany w bardziej czytelny sposób:
{
"imię": "Marcin",
"nazwisko": "Pietraszek",
"strona": {
"adres www": "https://www.samouczekprogramisty.pl",
"artykuły": [
{
"tytuł": "Format JSON w języku Java",
"data publikacji": {
"rok": 2018,
"miesiąc": 9,
"dzień": 13
}
}
]
}
}
Pobierz opracowania zadań z rozmów kwalifikacyjnych
Przygotowałem rozwiązania kilku zadań algorytmicznych z rozmów kwalifikacyjnych. Rozkładam je na czynniki pierwsze i pokazuję różne sposoby ich rozwiązania. Dołącz do grupy ponad 6147 Samouków, którzy jako pierwsi dowiadują się o nowych treściach na blogu, a prześlę je na Twój e-mail.
Odczyt
Każdy z przykładów poniżej używa instancji InputStream
, którą tworzę w sposób pokazany poniżej. Metoda buildObject
zwraca JsonObject
, który pokazałem w poprzednim paragrafie:
String jsonObject = buildObject().toString();
InputStream inputStream = new ByteArrayInputStream(jsonObject.getBytes());
Odczyt dokumentów w formacie JSON używa podobnego API. Tym razem tworzę instancję klasy JsonReaderFactory
. Używam jej do utworzenia instancji JsonReader
:
JsonReaderFactory readerFactory = Json.createReaderFactory(Collections.emptyMap());
JsonReader jsonReader = readerFactory.createReader(inputStream);
Klasa JsonReader
udostępnia kilka metod, które pozwalają na odczyt danych w formacie JSON:
readObject
,readArray
,readValue
,read
.
Używając publicznych metod udostępnionych w klasach JsonObject
i JsonArray
poruszam się po dokumencie JSON:
try (JsonReader jsonReader = readerFactory.createReader(new ByteArrayInputStream(jsonDocument.getBytes()))) {
JsonObject jsonObject = jsonReader.readObject();
System.out.println(jsonObject
.getJsonObject("strona")
.getJsonArray("artykuły")
.get(0).asJsonObject()
.getJsonObject("data publikacji")
);
}
Powyższy fragment kodu wyświetli na konsoli jeden z zagnieżdżonych obiektów:
{"rok":2018,"miesiąc":9,"dzień":13}
Istnieje jednak prostszy sposób na dotarcie do tego samego obiektu. Można posłużyć się ścieżką jak w przykładzie poniżej:
JsonReaderFactory readerFactory = Json.createReaderFactory(Collections.emptyMap());
try (JsonReader jsonReader = readerFactory.createReader(new ByteArrayInputStream(jsonDocument.getBytes()))) {
JsonStructure jsonStructure = jsonReader.read();
System.out.println(jsonStructure.getValue("/strona/artykuły/0/data publikacji"));
}
Tryb strumieniowy
Tryb strumieniowy pozwala na odczyt/zapis dokumentów w formacie JSON bez ładowania ich w całości do pamięci. Dane są odczytywane lub zapisywane na bieżąco.
Zapis
W przypadku zapisu fabryka JsonGeneratorFactory
pomaga w tworzeniu JsonGenerator
. Instancja tej klasy pisze do strumienia poszczególne tokeny (elementy składowe dokumentu w formacie JSON). metody write*
pozwalają na zapis danych do strumienia. Przykład poniżej zapisuje do strumienia dokładnie ten sam dokument JSON jaki użyłem w podejściu obiektowym:
JsonGeneratorFactory generatorFactory = Json.createGeneratorFactory(Collections.singletonMap(JsonGenerator.PRETTY_PRINTING, true));
JsonGenerator generator = generatorFactory.createGenerator(System.out);
generator
.writeStartObject()
.write("imię", "Marcin")
.write("nazwisko", "Pietraszek")
.writeStartObject("strona")
.write("adres www", "https://www.samouczekprogramisty.pl")
.writeStartArray("artykuły")
.writeStartObject()
.write("tytuł", "Format JSON w języku Java")
.writeStartObject("data publikacji")
.write("rok", 2018)
.write("miesiąc", 9)
.write("dzień", 13)
.writeEnd()
.writeEnd()
.writeEnd()
.writeEnd()
.writeEnd().flush();
Odczyt
W przypadku czytania dokumentu w trybie strumieniowym przydadzą się klasy JsonParserFactory
i JsonParser
. Instancja tej ostatniej pozwala na sprawdzenie czy w strumieniu znajduje się kolejny token. Jeśli tak, można go pobrać i odpowiednio na niego zareagować. Poniżej możesz zobaczyć przykład odczytywania dokumentu JSON w trybie strumieniowym:
JsonParserFactory parserFactory = Json.createParserFactory(Collections.emptyMap());
JsonParser parser = parserFactory.createParser(buildObject());
while (parser.hasNext()) {
JsonParser.Event event = parser.next();
switch (event) {
case START_OBJECT:
System.out.println("{");
break;
case END_OBJECT:
System.out.println("}");
break;
case START_ARRAY:
System.out.println("[");
break;
case END_ARRAY:
System.out.println("]");
break;
case KEY_NAME:
System.out.print(String.format("\"%s\": ", parser.getString()));
break;
case VALUE_NUMBER:
System.out.println(parser.getBigDecimal());
break;
case VALUE_STRING:
System.out.println(String.format("\"%s\"", parser.getString()));
break;
default:
System.out.println("true, false or null");
}
}
W wyniku działania tego kodu na konsoli wyświetli się dokument:
{
"imię": "Marcin"
"nazwisko": "Pietraszek"
"strona": {
"adres www": "https://www.samouczekprogramisty.pl"
"artykuły": [
{
"tytuł": "Format JSON w języku Java"
"data publikacji": {
"rok": 2018
"miesiąc": 9
"dzień": 13
}
}
]
}
}
Jak widzisz formatowanie tu kuleje :). Może spróbujesz napisać to w taki sposób, żeby dokument był bardziej czytelny?
JSON-B
JSON-B to specyfikacja, która pozwala na mapowanie dokumentów w formacie JSON i obiektów w języku Java. Pozwala na konfigurowanie sposobu mapowania obiektów na dokumenty przy pomocy adnotacji. Specyfikacja JSON-B 1.0 jest częścią JEE 8.
JSON-B pozwala na serializację i deserializację stanu obiektu używając formatu JSON.
Zapis obiektu
Zacznę od zwykłej klasy, dla czytelności usunąłem metody dostępowe (gettery i settery):
public class Newspaper {
private String title;
private int circulation;
private LocalDate issueDate;
@SuppressWarnings("unused")
public Newspaper() {
}
public Newspaper(String title, int circulation, LocalDate issueDate) {
this.title = title;
this.circulation = circulation;
this.issueDate = issueDate;
}
// getters & setters
}
Aby zapisać instancję tego obiektu do formatu JSON należy użyć JsonBuilder
do stworzenia instancji klasy Jsonb
. W większości przypadków ta instancja powinna być współdzielona w całej aplikacji.
Klasa Jsonb
posiada zestaw przeciążonych metod toJson
, które pozwalają na serializację obiektu. Przykład poniżej używa jednej z tych metod:
Newspaper newspaper = new Newspaper("Samouczek Programisty", 100_000, LocalDate.of(2018, 9, 13));
Jsonb jsonb = JsonbBuilder.create();
String newspaperRepresentation = jsonb.toJson(newspaper);
System.out.println(newspaperRepresentation);
Po wykonaniu tego fragmentu kodu na konsoli wyświetli się tekst:
{"circulation":100000,"issueDate":"2018-09-13","title":"Samouczek Programisty"}
Odczyt obiektu
Odczyt (deserializacja) przebiega w podobny sposób. Tym razem należy użyć metody fromJson
do odczytania dokumentu JSON. Zauważ, że drugim parametrem przekazywanym do tej metody jest klasa/typ nowotworzonego obiektu:
Newspaper newspaper = new Newspaper("Samouczek Programisty", 100_000, LocalDate.of(2018, 9, 13));
Jsonb jsonb = JsonbBuilder.create();
String newspaperRepresentation = jsonb.toJson(newspaper);
Newspaper otherNewspaper = jsonb.fromJson(newspaperRepresentation, Newspaper.class);
System.out.println(otherNewspaper.getIssueDate());
W wyniku działania tego kodu na konsoli wyświetli się data pobrana z dokumentu JSON:
2018-09-13
Modyfikacja zachowania JSON-B
JSON-B pozwala na modyfikację jego zachowania. Dzięki temu dokument, który jest tworzony/czytany może różnić się od obiektu w języku Java. Klasa AnnotationExamples
zawiera kilka adnotacji wpływających na kształt dokumentu JSON:
@JsonbPropertyOrder({"ccc", "bbb"})
public class AnnotationExamples {
@JsonbTransient
private String skipped;
@JsonbProperty(nillable=true)
private String a1;
private String a2;
@JsonbNumberFormat("0.0000")
private double bbb;
@JsonbProperty("other_name")
private String ccc;
// getters & setters
}
@JsonbTransient
– atrybut powinien zostać pomięty,@JsonbProperty
– pozwala na ustawienie nowej nazwy atrybutu. Zmienia zachowanie (de)serializacji jeśli atrybut ma wartośćnull
(domyślnie takie wartości są pomijane),@JsonbNumberFormat
– określa format w jakim powinna być zapisana liczba,@JsonbDateFormat
– określa format w jakim powinna być zapisana data.@JsonbPropertyOrder
– określa kolejność w jakiej atrybuty powinny być serializowane.
Pozostałe adnotacje znajdziesz w dokumentacji.
Miejsce umieszczenia adnotacji ma znaczenie:
- adnotacja nad atrybutem – ma wpływ zarówno na serializację jak i deserializację atrybutu,
- adnotacja nad getterem – ma wpływ wyłącznie na serializację atrybutu,
- adnotacja nad setterem – ma wpływ wyłącznie na deserializację atrybutu.
Proszę spójrz jak adnotacje wpływają na kształt generowanego dokumentu:
AnnotationExamples annotationExamples = new AnnotationExamples();
annotationExamples.setBbb(123.45);
annotationExamples.setCcc("ccc");
annotationExamples.setSkipped("skipped");
WithoutAnnotationExamples withoutAnnotationExamples = new WithoutAnnotationExamples();
withoutAnnotationExamples.setBbb(123.45);
withoutAnnotationExamples.setCcc("ccc");
withoutAnnotationExamples.setSkipped("skipped");
Klasa z adnotacjami:
{"other_name":"ccc","bbb":"123.4500","a1":null}
Klasa bez adnotacji:
{"bbb":123.45,"ccc":"ccc","skipped":"skipped"}
Adnotacje pozwalają na zmianę zachowana JSON-B w trakcie kompilacji. Istnieje także metoda na wprowadzenie takich zmian wyłącznie w trakcie uruchomienia programu.
json_pp
Nie mogę tu pominąć json_pp
. Jest to narzędzie używane w linii poleceń. Co prawda nie jest ono bezpośrednio związane z Javą ani specyfikacjami, które tu opisałem, jednak jest bardzo przydatne. Program ten formatuje dokument JSON wyświetlając go w bardziej czytelnej formie. Nie raz pomogło mi przy pracy z tym formatem:
$ echo '{"some":"magic","json":true,"values":123}' | json_pp
{
"json" : true,
"values" : 123,
"some" : "magic"
}
Dodatkowe materiały do nauki
Jeśli chcesz dowiedzieć się czegoś więcej na temat formatu JSON zachęcam Cię do sięgnięcia po materiały dodatkowe:
- Specyfikacja JSON specyfikacja ma kod 404 – kod odpowiedzi Not Found w specyfikacji protokołu HTTP :),
- Artykuł o JSON na Wikipedii,
- Specyfikacja JSON-P,
- Dokumentacja API JSON-P,
- Specyfikacja JSON-B,
- Dokumentacja API JSON-B.
Na pewno przyda Ci się też kod źródłowy przykładów użytych w artykule.
Zadanie do wykonania
Znajdź API udostępnione za pośrednictwem protokołu HTTP(S), które używa formatu JSON. Napisz program, który wyśle zapytanie do wybranego przez Ciebie API i przetworzy otrzymaną odpowiedź. Proszę daj znać w komentarzach, które API chcesz użyć. Jeśli masz problem ze znalezieniem API możesz użyć jednego z tych, które są zebrane na samouczkowym Github’ie.
Możesz także rzucić okiem na przykładowe rozwiązanie, w którym użyłem API NBP. Program, który napisałem pobiera średni kurs wymiany waluty dla zadanego dnia. Dzięki niemu możesz na przykład sprawdzić jaki był średni kurs USD/PLN w zadanym dniu.
Podsumowanie
Po przeczytaniu tego artykułu wiesz już czym jest JSON. Potrafisz stworzyć poprawny dokument w tym formacie. Wiesz jak używać specyfikacji z parasola JEE odpowiedzialnych za pracę z formatem JSON. Obecnie większość znanych mi API udostępnionych za pośrednictwem HTTP używa formatu JSON do wymiany danych. Po lekturze możesz swobodnie używać tych API z poziomu języka Java. Gratulacje! :)
Na koniec mam do Ciebie prośbę. Proszę podziel się linkiem do artykułu ze znajomymi, którym może się on przydać. Dzięki Tobie uda mi się dotrzeć do nowych czytelników. Jeśli nie chcesz ominąć kolejnych artykułów proszę dopisz się do samouczkowego newslettera i polub stronę Samouczka na Facebook’u. Do następnego razu!
Pobierz opracowania zadań z rozmów kwalifikacyjnych
Przygotowałem rozwiązania kilku zadań algorytmicznych z rozmów kwalifikacyjnych. Rozkładam je na czynniki pierwsze i pokazuję różne sposoby ich rozwiązania. Dołącz do grupy ponad 6147 Samouków, którzy jako pierwsi dowiadują się o nowych treściach na blogu, a prześlę je na Twój e-mail.
Zostaw komentarz