libopus/src/mlp.c

2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian/* Copyright (c) 2008-2011 Octasic Inc.
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   Written by Jean-Marc Valin */
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian/*
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   Redistribution and use in source and binary forms, with or without
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   modification, are permitted provided that the following conditions
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   are met:
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   - Redistributions of source code must retain the above copyright
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   notice, this list of conditions and the following disclaimer.
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   - Redistributions in binary form must reproduce the above copyright
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   notice, this list of conditions and the following disclaimer in the
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   documentation and/or other materials provided with the distribution.
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian*/
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#ifdef HAVE_CONFIG_H
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#include "config.h"
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#endif
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#include "opus_types.h"
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#include "opus_defines.h"
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#include <math.h>
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#include "mlp.h"
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#include "arch.h"
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#include "tansig_table.h"
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#define MAX_NEURONS 100
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#if 0
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanianstatic OPUS_INLINE opus_val16 tansig_approx(opus_val32 _x) /* Q19 */
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian{
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	int i;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	opus_val16 xx; /* Q11 */
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	/*double x, y;*/
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	opus_val16 dy, yy; /* Q14 */
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	/*x = 1.9073e-06*_x;*/
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	if (_x>=QCONST32(8,19))
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian		return QCONST32(1.,14);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	if (_x<=-QCONST32(8,19))
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian		return -QCONST32(1.,14);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	xx = EXTRACT16(SHR32(_x, 8));
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	/*i = lrint(25*x);*/
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	i = SHR32(ADD32(1024,MULT16_16(25, xx)),11);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	/*x -= .04*i;*/
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	xx -= EXTRACT16(SHR32(MULT16_16(20972,i),8));
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	/*x = xx*(1./2048);*/
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	/*y = tansig_table[250+i];*/
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	yy = tansig_table[250+i];
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	/*y = yy*(1./16384);*/
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	dy = 16384-MULT16_16_Q14(yy,yy);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	yy = yy + MULT16_16_Q14(MULT16_16_Q11(xx,dy),(16384 - MULT16_16_Q11(yy,xx)));
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	return yy;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian}
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#else
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian/*extern const float tansig_table[501];*/
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanianstatic OPUS_INLINE float tansig_approx(float x)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian{
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	int i;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	float y, dy;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	float sign=1;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	/* Tests are reversed to catch NaNs */
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    if (!(x<8))
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian        return 1;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    if (!(x>-8))
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian        return -1;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	if (x<0)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	{
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	   x=-x;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	   sign=-1;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	}
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	i = (int)floor(.5f+25*x);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	x -= .04f*i;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	y = tansig_table[i];
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	dy = 1-y*y;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	y = y + x*dy*(1 - y*x);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	return sign*y;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian}
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#endif
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#if 0
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanianvoid mlp_process(const MLP *m, const opus_val16 *in, opus_val16 *out)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian{
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	int j;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	opus_val16 hidden[MAX_NEURONS];
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	const opus_val16 *W = m->weights;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	/* Copy to tmp_in */
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	for (j=0;j<m->topo[1];j++)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	{
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian		int k;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian		opus_val32 sum = SHL32(EXTEND32(*W++),8);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian		for (k=0;k<m->topo[0];k++)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian			sum = MAC16_16(sum, in[k],*W++);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian		hidden[j] = tansig_approx(sum);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	}
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	for (j=0;j<m->topo[2];j++)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	{
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian		int k;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian		opus_val32 sum = SHL32(EXTEND32(*W++),14);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian		for (k=0;k<m->topo[1];k++)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian			sum = MAC16_16(sum, hidden[k], *W++);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian		out[j] = tansig_approx(EXTRACT16(PSHR32(sum,17)));
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian	}
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian}
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#else
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanianvoid mlp_process(const MLP *m, const float *in, float *out)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian{
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    int j;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    float hidden[MAX_NEURONS];
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    const float *W = m->weights;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    /* Copy to tmp_in */
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    for (j=0;j<m->topo[1];j++)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    {
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian        int k;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian        float sum = *W++;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian        for (k=0;k<m->topo[0];k++)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian            sum = sum + in[k]**W++;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian        hidden[j] = tansig_approx(sum);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    }
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    for (j=0;j<m->topo[2];j++)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    {
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian        int k;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian        float sum = *W++;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian        for (k=0;k<m->topo[1];k++)
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian            sum = sum + hidden[k]**W++;
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian        out[j] = tansig_approx(sum);
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian    }
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian}
2bd8b54017b5320bc0c1df9bf86f4cdc9f8db242Vignesh Venkatasubramanian#endif