Temat: unordered_map a zba9i.in

Ktoś doszedł czemu większość rozwiązań opartych na unordered_map wywalała się na teście 9i ('a'*150k+'b'*150k)?

#24538 | mik | Dodany: 2021-12-05 14:13:07

W rankingu nie ma informacji o tym, kto na jakich testach się wywalił...

Obstawiam, że problemem może być słaba funkcja haszująca generująca wiele kolizji. Standardowe funkcje hashujące zaimplementowane w gcc std::hash są słabe (powiedziałbym nawet mocniej, że błędne).

"How to pick a hash function" https://sortingsearching.com/2020/05/21/hashing.html

#24539 | Tomek Czajka | Dodany: 2021-12-05 14:42:10

> W rankingu nie ma informacji o tym, kto na jakich testach się wywalił...

No szkoda, ale są rozwiązania, można sobie sprawdzić. W szczególności wszystkie rozwiązania które dostały 9 punktów były oparte na unordered_map i wywalały się na teście 9i.

#24540 | mik | Dodany: 2021-12-05 15:16:42 | Ostatnia modyfikacja: 2021-12-05 16:32:15

> Obstawiam, że problemem może być słaba funkcja haszująca generująca wiele kolizji.

Jest to możliwy powód, jednak w ramach dzielenia się wiedzą zdradzę, że nie o to chodziło w większości rozwiązań, które miały problemy na tym teście. Problemem jest niewłaściwe używanie unordered_mapy, a dokładniej metody clear(). Usuwa ona co prawda pary (klucz, wartość) z hashmapy, jednak nie zmniejsza zarezerwowanej pamięci, tzn. bucket_count() pozostaje bez zmian.

Dokładniej mówiąc, jeśli najpierw umieścimy w unordered_mapie dużo kluczy, a następnie dużo razy wyczyścimy ją w niewłaściwy sposób (tzn. jedynie używając metody clear()), to za każdym razem czas czyszczenia zależny będzie od rozmiaru zarezerwowanej pamięci, czyli liniowy, przez co całe rozwiązanie będzie kwadratowe.

#24549 | Mateusz Radecki (moderator) | Dodany: 2021-12-05 20:08:19 | Ostatnia modyfikacja: 2021-12-05 20:10:41

> Problemem jest niewłaściwe używanie unordered_mapy, a dokładniej metody clear(). ...
O, dziękuję. Faktycznie o tym nie wiedziałem, a sprawdziłem, że w moim przypadku wystarczyło po wywołaniu clear() dodać rehash(2), żeby rozwiązać problem z zba9i. Chociaż równie dobrze i prościej można było zamienić unordered_map na map, chyba też by to przeszło.

#24550 | Jan Horodecki | Dodany: 2021-12-05 21:30:16 | Ostatnia modyfikacja: 2021-12-05 21:31:02

Nie wiem czy warto zakładać nowy temat, więc może zapytam tu: jak wygląda rozwiązanie z unordered_map? To jest wzorcówka czy są inne podejścia?

#24551 | Adrian Kotarski | Dodany: 2021-12-05 22:58:10

"wzorcówka"? nie widziałem nigdzie żadnego oficjalnego rozwiązania, więc jak na razie chyba ciężko jakieś konkretne nazwać wzorcowym.

Ja robię tak, że robię DP[b-a][c-a] => liczba stringów kończących się na aktualnej pozycji, które mają liczby a,b,c takie, że te różnice są jakie są. Wtedy DP jest mapą z offsetem pomiędzy "logicznymi" a "fizycznymi" kluczami, żeby móc np. przesunąć wszystko o (-1, -1) jak wejdzie nowe a.

#24552 | Maja Kądziołka | Dodany: 2021-12-05 23:18:30

Ja inkrementowałem 7 map (7, bo było 7 możliwości podciągów zbalansowanych: zawierających tylko litery kolejno: a, b, c, ab, bc, ca i abc). Indeksem był balans pomiędzy literami zliczanymi przez daną mapę. Jednoliterowe mapy były 0-wymiarowe (1 element), dwuliterowe - jednowymiarowe (różnice ilości wystąpień tych dwóch liter), a trzyliterowa - dwuwymiarowa (2 z 3 indeksów map dwuliterowych). Jak wystąpiła litera nie zliczana przez daną mapę i na koniec, zliczałem dla każdego indeksu wartości v*(v-1)/2 z map i je czyściłem (gdybym miał unordered_map to też by mi się wywaliło na teście 9i). Dla abc konieczna była mapa, bo przestrzeń indeksów była O(n^2), co by się nie zmieściło w pamięci (natomiast różnych indeksów było max n).

Teraz widzę że zamiast czyścić mapy można było użyć nieużywanego wymiaru do zmiany koszyka i zliczać tylko na koniec.

Przy okazji: rozwiązania zniknęły :(

#24553 | mik | Dodany: 2021-12-06 00:44:03

> Problemem jest niewłaściwe używanie unordered_mapy, a dokładniej metody clear().

Najgorsze, że standard języka C++ mówi, że m.clear() musi mieć złożoność O(m.size()).

https://en.cppreference.com/w/cpp/container/unordered_map/clear

Tylko jak się wczytać dokładniej w specyfikację, to okazuje się, że liczą tutaj tylko operacje na elementach, a nie całkowity czas działania metody.

#24554 | Tomek Czajka | Dodany: 2021-12-06 01:13:53

W takim razie kolejne czyszczenia powinny być już szybkie, bo m.size() po pierwszym się zeruje. To wygląda na niezgodność ze standardem, zwłaszcza że jest wprost napisane, że nie chodzi o ilość koszyków tylko ilość elementów:

> DR LWG 2550
> Applied to C++11
> Behavior as published for unordered associative containers, unclear if complexity is linear in the number of elements or buckets
> Correct behavior clarified that it's linear in the number of elements

#24570 | mik | Dodany: 2021-12-06 09:17:24

Okazuje się, że jednak jest technicznie zgodne ze standardem, bo:

https://eel.is/c++draft/container.requirements.general#2
> All of the complexity requirements in this Clause are stated solely in terms of the number of operations on the contained objects.

Jak mapa jest pusta, to clear() robi 0 operacji na elementach mapy -- ale ma prawo zrobić sobie ile chce innych obliczeń.

#24572 | Tomek Czajka | Dodany: 2021-12-06 09:30:11

Rzeczywiście nie jest to powiedziane, a IMHO powinno, bo w ten sposób, to clear() mógłby robić sleepa na 5 sekund i też by było zgodne ze standardem :)

#24574 | mik | Dodany: 2021-12-06 09:51:53

Łał, rzeczywiście paskudna pułapka, w życiu nie słyszałem o tym zachowaniu (i najwidoczniej ciężko je wyczytać z dokumentacji), a też się na to naciąłem.

#24629 | Piotr Jagiełło | Dodany: 2021-12-06 15:42:18

Internally unordered map is implemented using Hash Table, the key provided to map are hashed into indices of a hash table that is why the performance of data structure depends on hash function a lot but on an average, the cost of search, insert and delete from the hash table is O.

http://www.indigocard.vip/

#26370 | Whitney James | Dodany: 2022-01-04 11:38:13 | Ostatnia modyfikacja: 2022-01-05 04:50:12 | Wiadomość została zgłoszona do administracji

https://www.vassouras.rj.gov.br/profile/fildena200/profile
https://www.fhwa.dot.gov/reauthorization/reauexit.cfm?link=www,genericvillage.com/product/vidalista-20-mg/
https://www.fhwa.dot.gov/reauthorization/reauexit.cfm?link=www.genericvillage.com/product/kamagra-oral-jelly/
http://ideate.xsead.cmu.edu/discussion/introduction-to-media-synthesis-and-analysis/topics/viro-valor-xl-pills-to-last-longer-and-get-stronger?page=1
https://www.northliberty.in.gov/profile/cenforce/profile
http://blogs.harvard.edu/stoptorture/about/comment-page-543/

#26410 | kaxajep kaxajep | Dodany: 2022-01-05 11:05:17 | Wiadomość została zgłoszona do administracji

https://www.americangrainsusa.com/products/desktop-american-flag

#26640 | James Michael | Dodany: 2022-01-12 09:47:14 | Wiadomość została zgłoszona do administracji

https://bit.ly/3KnNvts
https://bit.ly/3tIGsFN
https://bit.ly/35bUm9p
https://bit.ly/3fHahhR
https://bit.ly/3IlUtgT
https://bit.ly/3IlpiCk
https://bit.ly/33xc1YL
https://dockr.ly/3KsJrbn
https://bit.ly/3Kucrzs
https://bit.ly/33XdJ5a
https://bit.ly/3IrszjI
https://bit.ly/3tIGGg7

#27133 | Toko Souvenir Custom Souvenir Terbaik | Dodany: 2022-01-24 05:54:44 | Wiadomość została zgłoszona do administracji