Парсер

В libVMR класс для парсера хранится в пакете libvmr.parsers с именем Parser.

Основное предназначения парсера - преобразование данных из формата CSV в двумерный массив данных. Для этой цели предназначен метод:

public double[][] parsing(File file)

где в качестве входного параметра используется экземпляр класса java.io.File, а в качестве возвращаемого значения двумерный массив с числовыми данными.

Поскольку в файле в формате CSV присутствуют не только числовые данные, но и идентификаторы переменных в двух первых строках, а также идентификаторы примеров в первом столбце, то метод сохраняет значения двух первых строк файла в приватных полях являющихся одномерными строковыми массивами: ids и units и исключает эти строки из возвращаемого массива, а значения идентификаторов первого столбца игнорируются. Т.е. проще говоря, парсер вырезает из входных данных всю нечисловую информацию, т.к. она не нужна для дальнейшей обработки. А оставшиеся числовые данные передаются далее в векторную машину и поступают там в Сепаратор.


Юрий Решетов
Comments