Свободная реализация массово-параллельной архитектуры (англ. massive parallel processing, MPP, также «массивно-параллельная архитектура») выполнения SQL-запросов на данных компьютерного кластера под управлением Apache Hadoop. Impala является свободной заменой Google F1.
Свободная СУБД для экосистемы Apache Hadoop. Его формат похож на колоночные форматы Hadoop, а именно на RCFile и оптимизированный RCFile. Он совместим с большинством механизмов обработки данных в среде Hadoop. Он обеспечивает эффективное сжатие данных и кодирование схем с повышенной производительностью для массовой обработки комплексных данных.
Инфраструктура хранения данных, построенная поверх Hadoop для обеспечения резюмирования данных, запросов и анализов. Hive даёт SQL-подобный интерфейс для запрашивания данных, хранящихся в разных базах данных и файловых системах, которые связаны с Hadoop.
Платформа анализа больших массивов данных, состоящих из высокоуровневого языка для анализа выраженных данных в сочетании с инфраструктурой для оценки этих программ. Характерным свойством программ Pig является то что их структура существенно распараллеленая, что в свою очередь позволяет им обрабатывать очень большие наборы данных.
Отладчик ядра GNU/Linux и ядер NetBSD и FreeBSD. Ему требуется две машины, которые соединены с помощью последовательного соединения. Последовательное соединение может быть RS-232 через нуль-модемный кабель или через сетевой протокол UDP /IP (KGDB через Ethernet, KGDBoE).
В вычислениях, Ceph - свободное хранилище объектов, которое сохраняет данные на одном распределенном компьютерном кластере и обеспечивает интерфейс уровня объекта, блока и файла. Основные цели Ceph - быть полностью распределенным без единой точки отказа, масштабируемой до уровня эксабайта и свободно доступным.
Container Linux от CoreOS (ранее CoreOS Linux) - свободная ОС на базе Linux, для обеспечения инфраструктуры компьютерных кластеров, с особым упором на автоматизацию, легкость установки, безопасность, надежность и масштабируемость.
Riak (произносится как "REE-Ack") представляет собой распределенное NoSQL key-value хранилище данных, которое обеспечивает высокую доступность, отказоустойчивость, простоту эксплуатации и масштабируемость. В дополнение к свободной версии, Riak имеет коммерческую версию и облачную версию. Riak реализует принципы Amazon Dynamo paper с сильным влиянием теоремы CAP (также известной как теорема Брюера). Написанный на Erlang, Riak имеет отказоустойчивую репликацию данных и автоматическое распределение данных в пределах кластера для производительности и устойчивости.