feat: Use container specific functions for vectors.

mchav · mchav · commit dbc1cd688478 · 2026-01-03T16:17:40.000-08:00
diff --git a/src/DataFrame/Internal/Column.hs b/src/DataFrame/Internal/Column.hs
@@ -333,13 +333,13 @@ sliceColumn start n (OptionalColumn xs) = OptionalColumn $ VG.slice start n xs
 atIndices :: S.Set Int -> Column -> Column
 atIndices indexes (BoxedColumn column) = BoxedColumn $ VG.ifilter (\i _ -> i `S.member` indexes) column
 atIndices indexes (OptionalColumn column) = OptionalColumn $ VG.ifilter (\i _ -> i `S.member` indexes) column
-atIndices indexes (UnboxedColumn column) = UnboxedColumn $ VG.ifilter (\i _ -> i `S.member` indexes) column
+atIndices indexes (UnboxedColumn column) = UnboxedColumn $ VU.ifilter (\i _ -> i `S.member` indexes) column
 {-# INLINE atIndices #-}
 
 -- | O(n) Selects the elements at a given set of indices. Does not change the order.
 atIndicesStable :: VU.Vector Int -> Column -> Column
 atIndicesStable indexes (BoxedColumn column) = BoxedColumn $ VG.unsafeBackpermute column (VG.convert indexes)
-atIndicesStable indexes (UnboxedColumn column) = UnboxedColumn $ VG.unsafeBackpermute column indexes
+atIndicesStable indexes (UnboxedColumn column) = UnboxedColumn $ VU.unsafeBackpermute column indexes
 atIndicesStable indexes (OptionalColumn column) = OptionalColumn $ VG.unsafeBackpermute column (VG.convert indexes)
 {-# INLINE atIndicesStable #-}
 
diff --git a/src/DataFrame/Internal/Expression.hs b/src/DataFrame/Internal/Expression.hs
@@ -159,7 +159,7 @@ interpretAggregation gdf (Lit value) =
         Aggregated $
             TColumn $
                 fromVector $
-                    V.replicate (VG.length (offsets gdf) - 1) value
+                    V.replicate (VU.length (offsets gdf) - 1) value
 interpretAggregation gdf@(Grouped df names indices os) (Col name) = case getColumn name df of
     Nothing -> Left $ ColumnNotFoundException name "" (M.keys $ columnIndices df)
     Just (BoxedColumn col) -> Right $ UnAggregated $ fromVector $ mkUnaggregatedColumnBoxed col os indices
@@ -701,7 +701,7 @@ interpretAggregation gdf@(Grouped df names indices os) expression@(AggNumericVec
                         Aggregated $
                             TColumn $
                                 fromVector $
-                                    V.map f (VG.map (VG.map fromIntegral) col)
+                                    V.map f (V.map (VU.map fromIntegral) col)
             Just Refl -> Right $ Aggregated $ TColumn $ fromVector $ V.map f col
         Right (UnAggregated _) -> Left $ InternalException "Aggregated into non-boxed column"
         Right (Aggregated (TColumn (BoxedColumn (col :: V.Vector d)))) -> case testEquality (typeRep @Integer) (typeRep @d) of
@@ -797,7 +797,7 @@ interpretAggregation gdf@(Grouped df names indices os) expression@(AggReduce exp
                     Aggregated $
                         TColumn $
                             fromVector $
-                                V.map (VG.foldl1' f) col
+                                V.map (V.foldl1' f) col
         Right (UnAggregated _) -> Left $ InternalException "Aggregated into non-boxed column"
         Right (Aggregated (TColumn column)) -> case foldl1Column f column of
             Left e -> Left e
@@ -1102,8 +1102,8 @@ mkUnaggregatedColumnBoxed ::
 mkUnaggregatedColumnBoxed col os indices =
     let
         sorted = V.unsafeBackpermute col (V.convert indices)
-        n i = os `VG.unsafeIndex` (i + 1) - (os `VG.unsafeIndex` i)
-        start i = os `VG.unsafeIndex` i
+        n i = os `VU.unsafeIndex` (i + 1) - (os `VU.unsafeIndex` i)
+        start i = os `VU.unsafeIndex` i
      in
         V.generate
             (VU.length os - 1)
@@ -1119,7 +1119,7 @@ mkUnaggregatedColumnUnboxed col os indices =
     let
         sorted = VU.unsafeBackpermute col indices
         n i = os `VU.unsafeIndex` (i + 1) - (os `VU.unsafeIndex` i)
-        start i = os `VG.unsafeIndex` i
+        start i = os `VU.unsafeIndex` i
      in
         V.generate
             (VU.length os - 1)
@@ -1139,7 +1139,7 @@ mkAggregatedColumnUnboxed col os indices f =
     let
         sorted = VU.unsafeBackpermute col indices
         n i = os `VU.unsafeIndex` (i + 1) - (os `VU.unsafeIndex` i)
-        start i = os `VG.unsafeIndex` i
+        start i = os `VU.unsafeIndex` i
      in
         VU.generate
             (VU.length os - 1)
@@ -1162,11 +1162,11 @@ mkReducedColumnUnboxed col os indices f = runST $ do
     let loopOut i
             | i == len = return ()
             | otherwise = do
-                let start = os `VU.unsafeIndex` i
-                let end = os `VU.unsafeIndex` (i + 1)
-                let initVal = col `VU.unsafeIndex` (indices `VU.unsafeIndex` start)
+                let !start = os `VU.unsafeIndex` i
+                let !end = os `VU.unsafeIndex` (i + 1)
+                let !initVal = col `VU.unsafeIndex` (indices `VU.unsafeIndex` start)
 
-                let loopIn !acc idx
+                let loopIn !acc !idx
                         | idx == end = acc
                         | otherwise =
                             let val = col `VU.unsafeIndex` (indices `VU.unsafeIndex` idx)
diff --git a/src/DataFrame/Operations/Aggregation.hs b/src/DataFrame/Operations/Aggregation.hs
@@ -7,6 +7,7 @@
 {-# LANGUAGE RankNTypes #-}
 {-# LANGUAGE ScopedTypeVariables #-}
 {-# LANGUAGE TypeApplications #-}
+{-# LANGUAGE Strict #-}
 
 module DataFrame.Operations.Aggregation where
 
@@ -15,7 +16,6 @@ import qualified Data.Map as M
 import qualified Data.Text as T
 import qualified Data.Vector as V
 import qualified Data.Vector.Algorithms.Merge as VA
-import qualified Data.Vector.Generic as VG
 import qualified Data.Vector.Unboxed as VU
 import qualified Data.Vector.Unboxed.Mutable as VUM
 
@@ -55,7 +55,7 @@ groupBy names df
         Grouped
             df
             names
-            (VG.map fst valueIndices)
+            (VU.map fst valueIndices)
             (changingPoints valueIndices)
   where
     indicesToGroup = M.elems $ M.filterWithKey (\k _ -> k `elem` names) (columnIndices df)
@@ -72,7 +72,7 @@ groupBy names df
                 case testEquality (typeRep @a) (typeRep @Int) of
                     Just Refl ->
                         VU.imapM_
-                            ( \i (x :: Int) -> do
+                            ( \i x -> do
                                 (_, !h) <- VUM.unsafeRead mv i
                                 VUM.unsafeWrite mv i (i, hashWithSalt h x)
                             )
@@ -81,7 +81,7 @@ groupBy names df
                         case testEquality (typeRep @a) (typeRep @Double) of
                             Just Refl ->
                                 VU.imapM_
-                                    ( \i (d :: Double) -> do
+                                    ( \i d -> do
                                         (_, !h) <- VUM.unsafeRead mv i
                                         VUM.unsafeWrite mv i (i, hashWithSalt h (doubleToInt d))
                                     )
@@ -120,7 +120,7 @@ groupBy names df
                 case testEquality (typeRep @a) (typeRep @T.Text) of
                     Just Refl ->
                         V.imapM_
-                            ( \i (t :: T.Text) -> do
+                            ( \i t -> do
                                 (_, !h) <- VUM.unsafeRead mv i
                                 VUM.unsafeWrite mv i (i, hashWithSalt h t)
                             )
@@ -142,13 +142,13 @@ groupBy names df
                     )
                     v
 
-        VA.sortBy (\(a, b) (a', b') -> compare b' b) mv
-        VG.unsafeFreeze mv
+        VA.sortBy (\(!a, !b) (!a', !b') -> compare b' b) mv
+        VU.unsafeFreeze mv
 
 changingPoints :: VU.Vector (Int, Int) -> VU.Vector Int
 changingPoints vs =
     VU.reverse
-        (VU.fromList (VG.length vs : fst (VU.ifoldl' findChangePoints initialState vs)))
+        (VU.fromList (VU.length vs : fst (VU.ifoldl' findChangePoints initialState vs)))
   where
     initialState = ([0], snd (VU.head vs))
     findChangePoints (!offsets, !currentVal) index (_, !newVal)
@@ -250,7 +250,7 @@ aggregate aggs gdf@(Grouped df groupingColumns valueIndices offsets) =
     let
         df' =
             selectIndices
-                (VG.map (valueIndices VG.!) (VG.init offsets))
+                (VU.map (valueIndices VU.!) (VU.init offsets))
                 (select groupingColumns df)
 
         f (name, Wrap (expr :: Expr a)) d =
@@ -267,12 +267,12 @@ aggregate aggs gdf@(Grouped df groupingColumns valueIndices offsets) =
 selectIndices :: VU.Vector Int -> DataFrame -> DataFrame
 selectIndices xs df =
     df
-        { columns = VG.map (atIndicesStable xs) (columns df)
-        , dataframeDimensions = (VG.length xs, VG.length (columns df))
+        { columns = V.map (atIndicesStable xs) (columns df)
+        , dataframeDimensions = (VU.length xs, V.length (columns df))
         }
 
 -- | Filter out all non-unique values in a dataframe.
 distinct :: DataFrame -> DataFrame
-distinct df = selectIndices (VG.map (indices VG.!) (VG.init os)) df
+distinct df = selectIndices (VU.map (indices VU.!) (VU.init os)) df
   where
     (Grouped _ _ indices os) = groupBy (columnNames df) df