Ir ao conteúdo
  • Comunicados

    • Gabriel Torres

      Seja um moderador do Clube do Hardware!   12-02-2016

      Prezados membros do Clube do Hardware, Está aberto o processo de seleção de novos moderadores para diversos setores ou áreas do Clube do Hardware. Os requisitos são:   Pelo menos 500 posts e um ano de cadastro; Boa frequência de participação; Ser respeitoso, cordial e educado com os demais membros; Ter bom nível de português; Ter razoável conhecimento da área em que pretende atuar; Saber trabalhar em equipe (com os moderadores, coordenadores e administradores).   Os interessados deverão enviar uma mensagem privada para o usuário @Equipe Clube do Hardware com o título "Candidato a moderador". A mensagem deverá conter respostas às perguntas abaixo:   Qual o seu nome completo? Qual sua data de nascimento? Qual sua formação/profissão? Já atuou como moderador em algo outro fórum, se sim, qual? De forma sucinta, explique o porquê de querer ser moderador do fórum e conte-nos um pouco sobre você.   OBS: Não se trata de função remunerada. Todos que fazem parte do staff são voluntários.
    • DiF

      Poste seus códigos corretamente!   21-05-2016

      Prezados membros do Fórum do Clube do Hardware, O Fórum oferece um recurso chamado CODE, onde o ícone no painel do editor é  <>     O uso deste recurso é  imprescindível para uma melhor leitura, manter a organização, diferenciar de texto comum e principalmente evitar que os compiladores e IDEs acusem erro ao colar um código copiado daqui. Portanto convido-lhes para ler as instruções de como usar este recurso CODE neste tópico:  
cyer

C++ Como testar o tempo de execução de um código no Visual Studio 2017?

Recommended Posts

Estou tentando testar o tempo de execução de um código, porém estou sempre obtendo valores incorretos, o primeiro teste vai ser sempre o que tem o pior tempo. E na maioria das vezes o segundo teste é sempre 0.

   

#include <iostream>
#include <math.h>
#include <intrin.h>
#include <chrono>

using namespace std;

#define MAX_LOOP                100000
#define NUM                     10000.f

auto sse_sqrt( float n )
{
    __m128 reg = _mm_load_ss( &n );
    return _mm_mul_ss( reg, _mm_rsqrt_ss( reg ) ).m128_f32[ 0 ];
}

auto stl_sqrt_timer()
{
    auto start = std::chrono::high_resolution_clock::now();

    for ( auto i = 0; i < MAX_LOOP; i++ )
    {
        auto v = std::sqrt( NUM );
    }

    auto end = std::chrono::high_resolution_clock::now();

    return ( end - start ).count();
}

auto sse_sqrt_timer()
{
    auto start = std::chrono::high_resolution_clock::now();

    for ( auto i = 0; i < MAX_LOOP; i++ )
    {
        auto v = sse_sqrt( NUM );
    }

    auto end = std::chrono::high_resolution_clock::now();

    return ( end - start ).count();
}

int main()
{
    cout << "stl_sqrt: " << stl_sqrt_timer() << "\n";
    cout << "sse_sqrt: " << sse_sqrt_timer() << "\n";

    cin.ignore();

    return 0;
}

Primeira execução:
sse_sqrt: 12461
stl_sqrt: 0

 

Segunda execução:
sse_sqrt: 2643
stl_sqrt: 378

 

Invertendo a ordem de testes:

 

Primeira execução:

stl_sqrt: 23032
sse_sqrt: 378

 

Segunda execução:

stl_sqrt: 2265
sse_sqrt: 0

 

 

Estou compilando em Release x86, com otimização /Ox
 

Editado por cyer
  • Curtir 1

Compartilhar este post


Link para o post
Compartilhar em outros sites

Não seria porque da segundo vez a CPU detecta a rotina em cache e faz os cálculos lá mesmo!?

  • Curtir 1

Compartilhar este post


Link para o post
Compartilhar em outros sites

 

1 hora atrás, AnsiC disse:

Não seria porque da segundo vez a CPU detecta a rotina em cache e faz os cálculos lá mesmo!?

 

Acredito que não, porque se fosse realmente isso iria acontecer sempre pois é passado o mesmo valor para ambas as funções, isso acontece apenas em 30 ~ 50% dos testes

Editado por cyer

Compartilhar este post


Link para o post
Compartilhar em outros sites

Eu pouco sei sobre as rotinas de um processador. Só vi que está chamando funções que lidam quase que diretamente com a rotina da cpu, então supos que fosse o cache de logo de cara. Boa sorte com seu enigma!

  • Curtir 1

Compartilhar este post


Link para o post
Compartilhar em outros sites

@AnsiC Obrigado, consegui resolver, eu estava fazendo errado, tinha que executar o teste por pelo menos 10000 vezes depois armazenar o tempo de cada teste em uma variável e depois dividir esse tempo pelo número de testes(10000)

 

#include <iostream>
#include <math.h>
#include <intrin.h>
#include <chrono>
#include <functional>

using namespace std;

#define MAX_LOOP                10000u

auto sse_sqrt( float n )
{
    __m128 reg = _mm_load_ss( &n );
    return _mm_mul_ss( reg, _mm_rsqrt_ss( reg ) ).m128_f32[ 0 ];
}

auto executar_teste( std::function< void() > t )
{
    auto timer = 0ull;
    
    for ( auto i = 0u; i < MAX_LOOP; ++i )
    {
        auto start = std::chrono::high_resolution_clock::now();

        t();

        timer += ( std::chrono::high_resolution_clock::now() - start ).count();
    }

    return timer / static_cast< unsigned long long >( MAX_LOOP );
}

auto stl_sqrt_t()
{
    return std::sqrt( 1000 );     
}

auto sse_sqrt_t()
{
    return sse_sqrt( 1000 );
}

int main()
{
    cout << "stl_sqrt: " << executar_teste( stl_sqrt_t ) << "\n";
    cout << "sse_sqrt: " << executar_teste( sse_sqrt_t ) << "\n";

    cin.ignore();

    return 0;
}

 

Primeira execução:

stl_sqrt: 69
sse_sqrt: 80

 

Segunda execução:

stl_sqrt: 72
sse_sqrt: 78

 

Terceira execução:

stl_sqrt: 71
sse_sqrt: 73

 

 

Editado por cyer
  • Curtir 3

Compartilhar este post


Link para o post
Compartilhar em outros sites

Crie uma conta ou entre para comentar

Você precisar ser um membro para fazer um comentário






Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas publicações sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×