Сейчас на сайте
Сейчас на сайте 0 пользователей и 0 гостей.

Удаление избыточных данных

DISTINCT (ОТЛИЧИЕ) - аргумент, который обеспечивает Вас способом устранять двойные значения из вашего предложения SELECT. Предположим, что вы хотите знать, какие продавцы в настоящее время имеют свои порядки в таблице Порядков. Под порядком (здесь и далее) будет пониматься запись в таблицу Порядков, регистрирующую приобретения, сделанные в определенный день определенным заказчиком у определенного продавца на определенную сумму). Вам не нужно знать, сколько порядков имеет каждый; вам нужен только список номеров продавцов (snum). Поэтому Вы можете ввести:

SELECT snum FROM Orders;

для поляучения вывода показанного в Рисунке 3.4

SQL Execution Log

SELECT snum

FROM Orders;

snum
1007
1001
1004
1002
1007
1003
1002
1001
1002
1001

Рисунок 3. 4: SELECT с дублированием номеров продавцов .

Для получения списка без дубликатов, для удобочитаемости, вы можете ввести следующее:

SELECT DISTINCT snum FROM Orders;

Вывод для этого запроса показан в Рисунке 3.5.

Другими словами, DISTINCT следит за тем, какие значения были ранее, так что бы они не были продублированы в списке. Это - полезный способ избежать избыточности данных, но важно что бы при этом вы понимали, что вы делаете. Если вы не хотите потерять некоторые данные, вы не должны безоглядно использовать DISTINCT, потому что это может скрыть какую-то проблему или какие-то важные данные. Например, вы могли бы предположить, что имена всех ваших заказчиков различны. Если кто-то помещает второго Clemens в таблицу Заказчиков, а вы используете SELECT DISTINCT cname, вы не будете даже знать о существовании двойника. Вы можете получить не того Clemens и даже не знать об этом. Так как вы не ожидаете избыточности, в этом случае вы не должны использовать DISTINCT.

ПАРАМЕТРЫ DISTINCT

DISTINCT может указываться только один раз в данном предложении SELECT. Если предложение выбирает многочисленные поля,

SQL Execution Log

SELECT snum

FROM Orders;

snum
1001
1002
1003
1004
1007

Рисунок 3.5: SELECT без дублирования

DISTINCT опускает строки, где все выбранные поля идентичны. Строки в которых некоторые значения одинаковы, а некоторые различны - будут сохранены. DISTINCT, фактически, приводит к показу всей строки вывода, не указывая полей ( за исключением когда он используется внутри агрегатных функций ), так что нет никакого смысла чтобы его повторять.

DISTINCT ВМЕСТО ALL

Вместо DISTINCT, вы можете указать - ALL. Это будет иметь противоположный эффект, дублирование строк вывода сохранится. Так как это - тот же самый случай когда вы не указываете ни DISTINCT ни ALL, то ALL - по существу скорее пояснительный, а не действующий аргумент.