Error while doing inference with "deserializeCudaEngine" engine which would do "setWeights" for a Conv. layer

higher127 · August 20, 2020, 8:59am

Description

With tensorRT 7.1.3, encounter a error in “enqueue” function while doing inference with “deserializeCudaEngine” engine which would do “setWeights” for a Conv. layer, but its OK with tensorRT 7.0.0.

Environment

TensorRT Version: tensorRT 7.1.3
GPU Type: RTX 2080
Nvidia Driver Version: 451.82
CUDA Version: 10.2
CUDNN Version: 8.0
Operating System + Version: Windows 10
Python Version (if applicable): 3.7.6
PyTorch Version (if applicable): 1.5

Is this issue reported before? how can i solver it ? thanks!

AakankshaS · August 20, 2020, 9:31am

Hi @higher127,
Can you please share your verbose error logs, script and the model, so that i can assist you better.
Thanks!

higher127 · August 25, 2020, 5:37am

Thanks for your reply. My working project is based on the official routine of tensorRT – “TensorRT-7.1.3.4 → samples → sampleMNIST”, and i just modified ‘build()’ function as below: (you should repeat the error easily)

bool SampleMNIST::build()
{
std::string serializeFile = “serializeFile.bin”;
if (_access(serializeFile.c_str(), 0) == -1)
{
auto builder = SampleUniquePtrnvinfer1::IBuilder(nvinfer1::createInferBuilder(sample::gLogger.getTRTLogger()));
if (!builder)
{
return false;
}

	auto network = SampleUniquePtr<nvinfer1::INetworkDefinition>(builder->createNetwork());
	if (!network)
	{
		return false;
	}

	auto config = SampleUniquePtr<nvinfer1::IBuilderConfig>(builder->createBuilderConfig());
	if (!config)
	{
		return false;
	}

	auto parser = SampleUniquePtr<nvcaffeparser1::ICaffeParser>(nvcaffeparser1::createCaffeParser());
	if (!parser)
	{
		return false;
	}

	if (!constructNetwork(parser, network))
	{
		return false;
	}

	builder->setMaxBatchSize(mParams.batchSize);
	config->setMaxWorkspaceSize(16_MiB);
	config->setFlag(BuilderFlag::kREFIT);
	config->setFlag(BuilderFlag::kGPU_FALLBACK);
	config->setFlag(BuilderFlag::kSTRICT_TYPES);
	if (mParams.fp16)
	{
		config->setFlag(BuilderFlag::kFP16);
	}
	if (mParams.int8)
	{
		config->setFlag(BuilderFlag::kINT8);
	}

	samplesCommon::enableDLA(builder.get(), config.get(), mParams.dlaCore);

	mEngine = std::shared_ptr<nvinfer1::ICudaEngine>(
		builder->buildEngineWithConfig(*network, *config), samplesCommon::InferDeleter());
	if (!mEngine)
		return false;

	assert(network->getNbInputs() == 1);
	mInputDims = network->getInput(0)->getDimensions();
	assert(mInputDims.nbDims == 3);

	// serialize the engine, then save it into disk.
	IHostMemory* gieModelStream{ nullptr };
	gieModelStream = mEngine->serialize();
	std::ofstream out(serializeFile.c_str(), std::ios::binary);
	if (out.is_open()) {
		out.write(reinterpret_cast<const char*>(gieModelStream->data()), gieModelStream->size());
		out.close();
	}
	else {
		std::cout << "Saving serializeFile error !" << std::endl;
		return false;
	}
	if (gieModelStream) {
		gieModelStream->destroy();
		gieModelStream = nullptr;
	}
}
else
{
	std::ifstream file(serializeFile, std::ios::binary);
	if (!file.is_open())
	{
		std::cout << "Open serializeFile error !" << std::endl;
		return false;
	}
	IRuntime* runtime = createInferRuntime(sample::gLogger.getTRTLogger());
	std::vector<char> trtModelStream;
	size_t size{ 0 };
	if (file.good())
	{
		file.seekg(0, file.end);
		size = file.tellg();
		file.seekg(0, file.beg);
		trtModelStream.resize(size);
		file.read(trtModelStream.data(), size);
		file.close();
	}
	mEngine = std::shared_ptr<nvinfer1::ICudaEngine>(runtime->deserializeCudaEngine(trtModelStream.data(), trtModelStream.size(), nullptr),
		samplesCommon::InferDeleter());
	if (!mEngine) { return false; }
	runtime->destroy();
	mInputDims = mEngine->getBindingDimensions(0);	
}
//
auto refitter = SampleUniquePtr<nvinfer1::IRefitter>(createInferRefitter(*mEngine, sample::gLogger));
if (refitter == nullptr) {
	std::cout << "engine is unrefittable !" << std::endl;
	return false;
}
const size_t kernel_size_ = 20 * 5 * 5;
float kernel[kernel_size_] = {0.0f};
Weights newWeights;
newWeights.count = kernel_size_;
newWeights.type = nvinfer1::DataType::kFLOAT;
newWeights.values = kernel;
if (!refitter->setWeights("conv1", WeightsRole::kKERNEL, newWeights)) {
	std::cout << "Set new weights error !" << std::endl;
	return false;
}
float bias[20] = { 0.0f };
Weights newBias;
newBias.count = 20;
newBias.type = nvinfer1::DataType::kFLOAT;
newBias.values = bias;
if (!refitter->setWeights("conv1", WeightsRole::kBIAS, newBias)) {
	std::cout << "Set new weights error !" << std::endl;
	return false;
}
// Find all weight parameters need update with above modification
int n = refitter->getMissing(0, nullptr, nullptr);
if (n > 0)
{
	std::vector<const char*> layerNames(n);
	std::vector<WeightsRole> weightsRoles(n);
	if (refitter->getMissing(n, layerNames.data(), weightsRoles.data()) != n)
	{
		return false;
	}
	for (int i = 0; i < n; ++i) {
		refitter->setWeights(layerNames[i], weightsRoles[i], Weights{});
	}
}
if (refitter->refitCudaEngine() != true)
{
	return false;
}

return true;

}

Thanks again !

AakankshaS · August 26, 2020, 8:15am

Hi @higher127,
Request you to share the --verbose logs.

Thanks!

higher127 · August 26, 2020, 9:17am

Do you mean using “trtexec.exe” to get verbose log ? If so, what verbose log of operations you need ? Sorry, I am new to use tensorRT. Thanks a lot.

AakankshaS · August 26, 2020, 10:04am

Hi @higher127,
I tried compiling sampleMNIST with the suggested changes, but couldnt because of some missing variables.
can you please upload the entire cpp file so as to avoid any mismatches.
Also please share the error logs from console.

Thanks!

higher127 · August 27, 2020, 1:48am

Hi @AakankshaS,
The crash information is:
Exception thrown at 0x00007FFFE0B5A719 in sample_mnist.exe: Microsoft C++ exception: std::out_of_range at memory location 0x000000EE409BEDF0.
Unhandled exception at 0x00007FFF3E8D4001 (nvinfer.dll) in sample_mnist.exe: Fatal program exit requested.
And the entire cpp file you can read below:
sampleMNIST.cpp (17.4 KB)
Thanks a lot.

higher127 · September 1, 2020, 8:40am

Hi @AakankshaS,
Can you repeat the crash issue with the entire cpp file ?
Thanks.

AakankshaS · December 1, 2020, 6:33am

Hi @higher127,
Apologies for the miss.
Are you still facing the issue?

Thanks!

higher127 · December 1, 2020, 9:08am

Hi @AakankshaS,
Thanks for your reply.
I am still facing the issue, but I do not know if the latest version have fixed the issue or not, as I have not updated it(still 7.1.3.4).
Thanks again.

[

higher127

higher127@163.com

](头像签名)

签名由网易邮箱大师定制

On 12/1/2020 14:34，Aakankshas via NVIDIA Developer Forums nvidia@discoursemail.com wrote：

AakankshaS · December 1, 2020, 10:18am

Hi @higher127,
Can you please check if you have shared all the dependent files, as i could not compile your script successfully.
Thanks!

Topic		Replies	Views
TensorRT-7.1.3.4 Deserialize the cuda engine failed TensorRT cuda	9	8230	March 28, 2024
cannot deserialize engine and segmentation fault(core dumped) TensorRT	1	1010	September 6, 2019
CUDA Error in TensorRT deserializeCudaEngine() TensorRT tensorrt , cuda , linux	5	3393	October 12, 2021
cannot deserialize engine and segmentation fault(core dumped) Jetson TX2	2	2243	October 18, 2021
trtexec Caffe to tensorrt conversion deserializeCudaEngine segfault TensorRT	2	1381	October 12, 2021
Inference error at engine.cpp::enqueue::293 TensorRT	4	2337	January 31, 2019
Using TensorRT3.0 to convert tensorflow model to create TensorRT engine Jetson TX1	3	649	March 8, 2018
TensorRT 5.0 convert the model and infer TensorRT	4	2664	October 12, 2021
Yolov5 Engine Inference error TensorRT tensorrt	3	1971	May 6, 2022
Trt_yolo_app TensorRT	4	1629	October 12, 2021

Error while doing inference with "deserializeCudaEngine" engine which would do "setWeights" for a Conv. layer

Description

Environment

Related topics