ATENÇÃO! PÁGINA EM ALTERAÇÃO - 18/06/2012


A seleção aleatória dos itens que comporão a amostra é condição indispensável para que uma amostra seja considerada estatística nos termos do item xx da NBC TA 530 - AMOSTRAGEM EM AUDITORIA, aprovada pela Resolução CFC nº 1.222/09 e constitui importante etapa na utilização de técnicas de amostragem em auditoria de forma que mostraremos como implementar as técnicas de seleção de amostras aleatórias usualmente utilizadas.


Serão Ilustradas as seguintes técnicas:

  • Amostra Aleatória Simples;
  • Amostra Sistemática;
  • Amostra Estratificada e
  • Amostra com Probabilidade de Seleção Proporcional ao Tamanho.

Na apresentação das técnicas de seleção de amostras, será considerado um tamanho de amostra de 10 itens para fins de simplificação da apresentação dos métodos de seleção.

Após a importação dos dados, é recomendável que se faça uma análise exploratória preliminar dos mesmos, com a finalidade de auxiliar na definição do plano de amostragem a ser utilizado.  Esta análise pode consistir da determinação da amplitude, assimetria, e distribuição dos dados, além de outras análises que o auditor entender pertinentes.

Usaremos o conjunto de dados Invoices.csv para ilustrar os procedimentos.  A importação deste conjunto de dados para o R é feita da seguinte forma:

> faturas <- read.csv2("Invoices.csv")

Após a importação de uma base de dados, é sempre recomendável inspecionar os dados. Uma forma conveniente de se fazer isso é usando a função str().

> str(faturas)
'data.frame':   4999 obs. of  8 variables:
 $ Date       : Factor w/ 365 levels "01/01/2003","01/02/2003",..: 103 248 320 ...
 $ InvoiceNo  : int  20000 20001 20002 20003 20004 20005 20006 20007 20008 ...
 $ CustomerNo : int  10220 10491 10704 10430 10841 10777 10653 10413 10654 ...
 $ SalesPerson: int  8 4 3 5 17 1 19 12 12 1 ...
 $ ProductNo  : int  8 48 43 54 11 5 58 61 4 10 ...
 $ UnitPrice  : num  9.2 14 15 24 15 12.5 24 31 34.8 49.3 ...
 $ Quantity   : int  41 30 25 22 21 50 2 51 21 5 ...
 $ Amount     : num  377 420 375 528 315 ...

Amostra Aleatória Simples (AAS) - item 11.11.3.2 da NBC-T 11.11

Na AAS cada elemento da população possui igual probabilidade de ser selecionado para pertencer à amostra.  Assim, um lançamento cujo valor seja de R$ 15,00 tem a mesma probabilidade de seleção que um lançamento de R$ 700.000,00.

A AAS pode ser selecionada com reposição ou sem reposição, sendo que na prática utiliza-se a amostragem sem reposição.  Uma amostra aleatória simples sem reposição pode ser selecionada seguindo-se os seguintes passos:

 - Definição da semente a ser utilizada

Esta etapa é importante para que seja possível a conferência posterior da amostra selecionada, já que será possível gerar, posteriormente, a mesma amostra aleatória sorteada pelo auditor, o que é de grande utilidade na etapa de revisão dos trabalhos.

A definição da semente é feita utilizando-se a função set.seed(). Embora a semente possa ser qualquer número, optamos por utilizar uma semente gerada aleatoriamente com a função runif() que gera, por default,  um número aleatório entre 0 e 1.  Os comandos seguintes ilustram como fazer isso:

> runif(1)
[1] 0.2390956
> set.seed(2390956)

 - Seleção da Amostra

Estando os dados a serem amostrados em um data frame chamado faturas, a seleção de uma amostra aleatória dos registros pode ser feita da seguinte forma:

> amostra <- faturas[runif(10, 1, nrow(faturas)),]
> amostra
           Date InvoiceNo CustomerNo SalesPerson ProductNo UnitPrice Quantity
4190 27/05/2003     24190      10347           4        61     31.00       38
2919 16/06/2003     22919      10274          17        50     10.00        6
3458 21/06/2003     23458      10338           9        57     19.00       17
2715 15/09/2003     22715      10894          21        51     14.00       22
1542 26/01/2003     21542      10180          14        37     13.25       27
937  18/04/2003     20937      10904          10        46     15.50       42
1049 15/06/2003     21049      10720          14         8      9.20       25
4472 31/05/2003     24472      10108          15         5     12.50       19
295  04/09/2003     20295      10791           2        33     18.00       20
2609 14/03/2003     22609      10275          13        36     17.45       29
       Amount
4190 1.178,00
2919    60,00
3458   323,00
2715   308,00
1542   357,75
937    651,00
1049   230,00
4472   237,50
295    360,00
2609   506,05

Para salvar a amostra selecionada em um arquivo que possa ser aberto e editado posteriormente no Excel, onde os procedimentos de auditoria aplicáveis possam ser documentados, utiliza-se o comando write.csv2(), que salva a amostra selecionada em disquete, em um arquivo chamado amostra.csv.

> write.csv2(amostra, file="a:/amostra.csv")

Amostra Sistemática (AS)  - item 11.11.3.3 da NBC-T 11.11

A amostra sistemática caracteriza-se pela seleção dos itens da amostra em intervalos regulares ao longo de toda a população, após a seleção aleatória do 1º elemento da amostra.  Ou seja, após a seleção aleatória do primeiro elemento dentro do intervalo de amostragem, os demais elementos da amostra constituem-se em termos de uma progressão aritmética cuja razão é o intervalo de amostragem.

Na utilização da amostragem sistemática o auditor deve tomar o cuidado de certificar-se de que os elementos da população não apresentam nenhum ciclo, o que poderá inviabilizar o uso dessa metodologia de seleção de amostras.

O intervalo de amostragem (I) é dado pelo quociente entre o tamanho da população (N) e o tamanho da amostra a ser selecionada (n).

O procedimento pode ser implementado da seguinte forma:

 - Cálculo do Intervalo de Amostragem

> N <- nrow(faturas)    # Tamanho da População
> n <- 10               # Tamanho da Amostra
> I <- round(N/n)       # Intervalo de Amostragem (valor arredondado)


- Definição da Semente a ser Utilizada

> runif(1)
[1] 0.4570949
> set.seed(4570949)

- Sorteio Aleatório do Primeiro Elemento da Amostra entre 1 e I

> n0 <- runif(1, min=1, max=I)

 - Determinação dos Demais Itens da Amostra

Deve ser observado que os demais itens da amostra constituem os elementos de uma progressão aritmética de razão I, cujo termo inicial é n0, já determinado acima. Para isso será utilizada a função seq().

> indice <- seq(n0, n0 + (n-1) * I, I)

Obtenção dos registros correspondentes aos indices determinados acima mais o termo n0.

> amostra2 <- faturas[indice,]

Para salvar a amostra selecionada, o procedimento a ser utilizado é o mesmo já descrito acima, utilizando a função write.csv2().

Amostra Estratificada (AE) - item 11.11.2.4 da NBC-T 11.11

Estratificação é o procedimento pelo qual a população a ser amostrada é dividida em subpopulações mutuamente exclusivas, denominadas estratos, dos quais são selecionadas amostras aleatórias simples.

Os estratos devem ser determinados de forma que cada um deles seja o mais homogêneo possível quanto a variável objeto de análise.  A estratificação objetiva melhorar a eficiência do estimador utilizado.

Algumas questões que se colocam quando se opta pela seleção de uma amostra estratificada são:

- Em quantos estratos deve ser dividida a população?
- Como delimitar cada estrato?
- Quantos itens de cada estrato devem ser selecionados para compor a amostra?

Para ajudar na obtenção de respostas para estas questões é necessário uma análise preliminar da população a ser auditada, e um procedimento muito útil é a elaboração de um “perfil” da população conforme já recomendado anteriormente.

A definição da quantidade de estratos em que a população deve ser dividida é definida pelo auditor com base na análise da população de itens.

Para definição dos limites, o auditor pode usar uma abordagem subjetiva ou pode utilizar alguma metodologia de estratificação.

A NBC-T 11.11 em seu item 11.11.2.4.4 sugere o uso da abordagem subjetiva, onde os limites dos estratos são definidos com base no conhecimento que o auditor tem da população a ser amostrada.

Ilustraremos aqui uma metodologia denominada Método da Acumulação da Raiz Quadrada das Freqüências que busca otimizar a homogeinedade dos estratos. 

Para a realização da estratificação, escrevemos a função estratos() por meio da qual o referido método foi implementado.

Antes, contudo é recomendável dar uma olhada na distribuição dos valores das faturas com vistas delimitar limites de materialidade.

> with(faturas, quantile(Amount, seq(0,1, 0.1)))
     0%     10%     20%     30%     40%     50%     60%     70%     80%     90%
    5.0    93.0   180.0   265.4   352.5   450.0   573.7   722.0   986.0  1548.0
   100%
13438.5

Vamos dar uma olhada na quantidade de faturas com valores entre R$1548,00 (9º decil) e R$13438,50 (valor máximo) para verificarmos a possibilidade de examiná-las em sua totalidade.

> nrow(subset(faturas, Amount > 1548))
[1] 499

São muitas faturas para serem inspecionadas em sua totalidade... Vamos aumentar um pouco mais o limite para inspeção completa.

> nrow(subset(faturas, Amount > 10000))
[1] 31

Agora temos um quantitativo bem mais razoável.  Vamos estratificar a população de faturas cujos valores sejam superiores a R$100,00 e inferiores a R$10.000,00. As faturas cujos valores sejam inferiores a R$100,00 não serão incluídas na amostra em razão do baixo valor das mesmas e as faturas com valores superiores a R$10.000,00 (31 faturas) serão examinadas em sua totalidade.

Vamos usar 4 estratos. ( Esta escolha é inteiramente arbitrária... )

> estratos(faturas$Amount, nest=4, intclas=10, limInf=100, limSup=10000)

        Limites dos Estratos

Estrato 1 :  ( 100 - 410.31 ]
Estrato 2 :  ( 410.31 - 800.71 ]
Estrato 3 :  ( 800.71 - 1571.49 ]
Estrato 4 :  ( 1571.49 - 9749.75 ]

Obtidos os limites dos estratos, o próximo passo é determinar quantos itens deverm ser selecionados em cada estrato.  Existem na literatura alguns métodos para realizar esta alocação.  Vamos ilustrar aqui um método denominado 'alocação de Neyman'.

[  A  elaborar... ]

Amostra com Probabilidade de Seleção Proporcional ao Tamanho (PPT). 

Infelizmente, a NBC-T 11.11 não menciona esta técnica de seleção de amostras, como também não faz qualquer referência à Amostragem de Unidades Monetárias, técnica de amostragem muito utilizada pelos auditores, e implementada em diversos softwares de auditoria. 

A seleção de amostras com probabilidade de seleção proporcional ao tamanho, caracteriza-se pela atribuição de probabilidades distintas de seleção a cada item da população, com base em alguma medida do “tamanho” ou “peso” dos referidos itens.  Em uma auditoria financeira, parece razoável atribuir maior probabilidade de seleção aos itens cujo valor seja elevado, privilegiando esses itens na seleção da amostra.

Esta técnica de seleção de amostra é utilizada na Amostragem de Unidades Monetárias, técnica de amostragem especificamente desenvolvida para uso em auditorias financeiras.

> prob.selec <- faturas$Amount / sum(faturas$Amount)
> runif(1)
[1] 0.07827719
> set.seed(07827719)
> amostra <- faturas[sample(1:nrow(faturas), n, prob=prob.selec),]