Formaty plików w Data Lake to nowe CSV w chmurze. Są one bardziej zorientowane na kolumny i kompresują duże pliki z dodatkowymi funkcjonalnościami. Głównymi graczami w tym obszarze są Apache Parquet, Apache Avro i Apache Arrow. Stanowią one fizyczną pamięć z rzeczywistymi plikami rozproszonymi w różnych kubełkach w Twoim Storage Layer Object Store.