Subsections

Solu��o Adotada

O projeto foi separado em dois blocos principais: um para Detec��o de Frequ�ncias e Dura��o e um para a Gera��o de MIDI. Essa metodologia foi escolhida visando paralelizar o desenvolvimento do projeto, aumentando a produtividade, al�m de aumentar a reusabilidade do projeto. A separa��o em blocos ajudou muito nos testes durante o desenvolvimento, permitindo que eles pudessem ser testados individualmente.

O objetivo inicial do projeto era utilizar a entrada de �udio da placa para fazer captura direta da guitarra, passando pelo ADC^5.1 e aplicando uma FFT^5.2 sobre essas amostras, para ent�o identificar a frequ�ncia e dura��o das notas tocadas e fazer uma tradu��o para o formato MIDI. Por�m, a captura da placa usada no projeto n�o pode ser utilizada, e substituimos a entrada do programa para um arquivo de �udio puro, gravado num computador e passado para a placa.

Vis�o geral

A fun��o principal do m�dulo de detec��o de frequ�ncias segue a estrutura de um executivo c�clico. Os dados de entrada (�udio) s�o obtidos a partir de um arquivo e a cada ciclo s�o lidas FFT_SIZE amostras, onde FFT_SIZE � o tamanho do vetor que serve de entrada para a FFT.

Ap�s a leitura � realizada a transformada e seu resultado armazenado em um buffer de n�meros complexos, tamb�m com tamanho FFT_SIZE. Este resultado, por sua vez, serve commo entrada para o bloco de detec��o da frequ�ncia fundamental.

Ap�s a detec��o da frequ�ncia, cabe � fun��o is_event() determinar se o a�dio sendo analisado constitui uma nova nota (ou sil�ncio), ou � apenas a continua��o de uma nota anteriormente detectada.

Todos os blocos funcionais ser�o detalhados adiante.

Detec��o de Frequ�ncias e Dura��o

A fun��o do primeiro grande bloco do projeto era pegar amostras da entrada de �udio, aplicar a FFTs nas amostras recolhidas, identificar a frequ�ncia e a dura��o das notas tocadas e gerar uma sa�da definida pela seguinte struct C. Tal sa�da � uma representa��o simb�lica da nota:

            typedef struc note {
                pitch_t pitch;
                int time;
                bool on;
            } note_t;

A struct possui tr�s campos inteiros (com pitch_t e bool sendo dois typedef para int), onde o primeiro, pitch, determina o valor no formato MIDI para a frqu�ncia detectada, o segundo, time, o instante no tempo em que a nota foi detectada e o terceiro, on, determina se o evento MIDI gerado ser� um NOTEON ou NOTEOFF.

Essa sa�da do primeiro bloco do projeto, uma stream de elementos do tipo note_t, era a entrada esperada pelo segundo bloco.

Convers�o MIDI

A partir da sa�da do bloco anterior, a fun��o do bloco de Convers�o MIDI era criar um arquivo a partir das informa��es obtidas dos elementos note_t, assim como todo o cabe�alho e demais dados necess�rios ao formato MIDI. Por ter sido feito separadamente, foi mais f�cil testar esse bloco, com entradas e sa�das esperadas criadas especialmente para esse fim, verificando assim quaisquer poss�veis erros na convers�o.

FFT

A parte mais importante do trabalho foi certamente o uso da Transformada de Fourier[3] (FFT), para obter a distribui��o (histograma) das frequ�ncia presentes no sinal de entrada. A FFT realiza uma convers�o de dom�nio, transformando o sinal de entrada do dom�nio do tempo para o dom�nio das frequ�ncias. A figura[] ilustra esse processo.

**Figura:** Entrada da FFT, um sinal digital no dom�nio do tempo

**Figura:** Sa�da da FFT, sinal onde o eixo x representa a frequ�ncia

A implementa��o de FFT utilizada no projeto foi a presente na biblioteca de processamento digital de sinais do Blackfin, a libbfdsp[6]. Mais especificamente, a fun��o utilizada foi a rfftrad4_fr16, uma FFT com entrada real e sa�da complexa. Abaixo est� a assinatura da fun��o:

        void rfftrad4_fr16(const fract16
            input[],
            complex_fract16 temp[],
            complex_fract16 output[],
            const complex_fract16 twiddle_table[],
            int twiddle_stride,
            int fft_size,
            int block_exponent,
            int scale_method);

Para an�lise das frequ�ncias foram utilizados apenas os valores absolutos da sa�da da transformada.

Detec��o de Frequ�ncia Fundamental

O algoritmo de detec��o da frequ�ncia fundamental recebe a sa�da da FFT, ou seja, um histograma contendo informa��es da intensidade relativa de cada um dos harm�nicos presentes no sinal. Cabe a este bloco determinar qual � a frequ�ncia fundamental, que � a frequ�ncia percebida pelo ouvinte.

Inicialmente hav�amos adotado um crit�rio bastante simples para a determina��o de tal frequ�ncia: selecion�vamos a frequ�ncia com a maior intensidade. A partir de experimentos realizados com a captura da pr�pria guitarra percebemos, por�m, que nem sempre a frequ�ncia mais intensa era a fundamental. As figuras 5.3 e 5.4 demonstram, respectivamente, os casos onde a fundamental � mais intensa e onde isso n�o ocorre.

**Figura:** Espectro de frequ�ncia para G4

**Figura:** Espectro de frequ�ncia para G#4

A partir da observa��o dos espectros das notas, percebemos que era suficiente obter os picos da fun��o e, dentre estes picos, escolher o de menor frequ�ncia, que � a fundamental da nota.

            get_fundamental_index(frequency_spectrum) {
                peaks[FFT_PARTITIONS];
                
	            for(i = 0; i < FFT_PARTITIONS; i++) {
	                max_index = 0;
	                max = 0;
	                
	                for(j = 0; j < FFT_PARTITION_SIZE; j++) {
	                    index = i*FFT_PARTITION_SIZE + j;
	                    cur = abs(frequency_spectrum[index]);
	                    if(cur > max) {
	                        max = cur;
	                        max_index = index;
	                    }
	                }
	    
	                peaks[i].index = max_index;
	                peaks[i].val = max;
	            }
	         
	            sort(peaks, FFT_PARTITIONS, peaks.val);
	            sort(peaks, FIRST_HARMONICS, peaks.index);
	               
	        }

Detec��o de Eventos

Como uma nota tocada pode ter uma dura��o maior que o tempo de execu��o de uma FFT, vimos que seria necess�rio algum tipo de detec��o de eventos, capaz de dizer se a entrada da FFT atual caracterizava um evento novo, ou se era somente a continua��o de uma nota anterior.

A id�ia original para se resolver este problema, seria aplicar algum filtro no sinal de entrada, antes de se aplicar a FFT em si, mas acabamos por adotar uma solu��o mais simples. Basicamente comparamos a frequ�ncia da nota atual com a da anterior e, caso as notas detectadas sejam diferentes, um evento est� caracterizado, seja por uma nova nota sendo tocada, ou por sil�ncio sendo reconhecido.

Este modelo criou um outro problema, pois ap�s uma nota ser tocada no instrumento, a frequ�ncia obtida pelo programa varia muito, e se estabiliza ap�s algum tempo. Por este motivo, logo ap�s a detec��o de um evento fazemos um descarte de algumas FFTs, at� que a entrada esteja est�vel. O n�mero mais adequado de FFTs a se descartar foi encontrado atrav�s de testes, variando a quantidade de descartes at� encontrar um valor que obtivesse o melhor resultado.

Jo�o Paulo Pizani Flor 2010-07-12